AI 활용법

GPT4-비전을 통해 가능한 실생활 활용 10가지

작성자 정보

  • 관리자 작성
  • 작성일

컨텐츠 정보

본문

GPT4-V로 활용할수 있는 10가지를 함께 알아보겠습니다. GPT-4V는 “Generative Pre-trained Transformer 4 Versatile”의 약어로, OpenAI가 개발한 다음 세대의 자연어 처리 및 생성 모델입니다. 이 모델은 이전 버전인 GPT-3보다 더 뛰어나고 다재다능하며, 다양한 작업과 업무 영역에서 활용될 것으로 예상됩니다.


목차


1. GPT4-V의 사물 인식

2. GPT4-V의 장소 인식

3. GPT4-V의 사람 인식

4. GPT4-V의 시각적 참조

5. GPT4-V의 글자 읽기(OCR)

6. GPT4-V의 도표, 기호 읽기

7. GPT4-V의 그래프, 인포 그래픽, 차트 읽기

8. GPT4-V의 믄제 해결

9. GPT4-V의 텍스트에 대한 이해 및 문제 풀기

10. GPT4-V의 이미지에 대한 이해와 피드백


1. 사물 인식

사물인식.jpg

 

GPT4 비전은 우리 주위에 있는 물건이나 음식, 도구 등을 잘 인식합니다. 사물을 사진으로 찍어 GPT4에게 주고 이름이 무엇인지, 어디서 살 수 있는지 물어보면 사물의 이름을 알려줍니다. 음식 사진을 찍어 물어봐도 이 음식이 무엇이며, 어떤 음식이며 레시피 정보까지 얻을수 있습니다.


2. 장소 인식

 

장소인식.jpg

 

GPT4 비전은 장소에 대한 인식도 합니다. 사진을 찍어 올리면 그곳이 어디에 있는지 챗지피티가 알려줍니다. 장소에 대해 묻는다면 GPT-4가 장소의 이름과 설명해 해 줍니다. 이뿐 아니라 자연 경관에 대해서도 잘 알려줍니다. 자연경관 사진을 올리면 장소의 이름과 설명도 잘해 줍니다.


3. 사람 인식

GPT-4는 사람을 인식할 수 있습니다. 예를들어, 스티브 잡스의 사진을 주고 이 사진을 설명해 달라고 하면 도와줄 수 없다고 합니다. 사람들의 프라이버시를 보호하기 위해 답변을 거부하기도 합니다. 앞의 사물과 장소와 달리 사람에 대해서는 프라이버시 관련된 사항에 대해서는 답을 거부하고 중립적인 부분에서만 대답을 해 줍니다. 사람은 어떤 행동을 묻는다면 그 사람의 행동에 대해서는 설명을 해줍니다. 이렇듯 프라이버시가 아닌 질문에 대해서는 대답을 잘 해 줍니다.


4. 시각적 참조

시각적참조.jpg

 

그림의 내용이 많을 때 GPT 상에서 특정한 부분을 가리키고 싶을 때 사용할 수 있는 방법을 소개합니다. 오디오 믹서와 같은 음향 기구를 보면 여러 개의 비슷한 버튼들이 배열되어 있는데, 특정 버튼들이 무엇을 하는지 잘 모를경우   그림의 일부분을 가리고 싶을 때 동그랗게 궁금한 부분을 표시해 주고 동그라미 안에 있는게 무엇인지 GPT-4 물어봅니다. 그러면 GPT 4가 동그라미 안에 있는 것은 팬텀 48V 버튼이라고 하고 여기에 대한 설명을 줍니다. 그 후 다시 여기에 대해 추가 질문을 해 줄 수 있습니다. 그러면 GPT-4가 동그라미 안에 있는 것은 팬텀 48V 버튼이라고 하고 여기에 대한 설명을 줍니다. 그 후 다시 여기에 대해 언제 버튼을 누르는지등 추가 질문을 하면 답변을 줍니다. 


5. 글자 읽기(OCR)

GPT-4는 OCR 글자 읽기 기능입니다. 이 기능은 스캐너나 핸드폰에서 이미 지원하고 있는 기능입니다. GPT4는 여기에서 한 발 더 나아가 프롬프트를 간단히 주고 테이블(표)이 있다면, 그 테이블도 정확하게 읽어내어 테이블 포맷으로 변환해 줍니다. 그뿐만 아니라 손글씨 노트 자료의 작은 화살표 등의 기호들과 번호들도 잘 변환해 줍니다. 


 

 

6. 도표, 기호 읽기

GPT-4는 요약된 노트 필기를 바탕으로 완전한 문장의 기술 노트를 작성해 줄수 있습니다. GPT-4는 도표와 기호들도 읽을 수 있습니다. 영양 성분표를 찍어 올리면 성분을 분석할수 있으며 기본적인 정보와 칼로리, 지방, 탄수화물 등의 함량을 읽어서 표시해 주고 성분에 대해서도 알려줄 수 있습니다. GPT-4는 이외에도 낯선 거리의 신호나 표지판에 대해서도 잘 알려주고 자동차의 대시보드 램프 등도 읽을수 있습니다.


7. 그래프, 인포 그래픽, 차트 읽기

챠트의이해.jpg

 

GPT-4는 그래프 인포그래픽, 차트, 다이어그램도 읽을 수 있습니다. 그래프의 전반적인 설명과 포인트를 알려줄수 있습니다. 예를 들어, 애플의 소득에 대한 인포그래픽을 주면 흩어져 있는 숫자들을 모아 각 제품의 수익 및 증감에 대한 내용 정리를 해 줍니다. 한 회사의 주식 차트를 분석해 달라고 하면 GPT-4가 여기에 대한 그래프와 숫자를 바탕으로 자료를 분석해 주고 마지막으로는 총평까지 해줍니다. 


8. 문제 해결

GPT-4는 문제를 이해하고 그 문제의 해결에 도움을 줄수 있습니다. 예를들면, 냉장고에 남아 있는 재료들로 무엇을 만들어 먹어야 할지 고민될 때 GPT-4에게 물어볼 수 있습니다. 사진의 재료들로 뭘 만들 수 있을지, 재료도 달라고 하고 레시피도 추천해 달라 하면 재료들을 잘 파악하고, 냉장고에 있는 재료로 만들수 있는 요리와 레시피를 추천해 줍니다. 


9. 텍스트에 대한 이해 및 문제 풀기

GPT-4는 텍스트에 대한 인식을 넘어 글을 이해하고 문제를 풀 수 있습니다. 시험 문제를 사진 찍은 뒤 프롬프트로 문제를 풀어보라 하면 이 답을 써야 하는지를 차근차근 써 내려간 뒤 답을 줍니다. GPT-4는 문자 그림 인식을 넘어 논리적인 지적 기능까지 수행하고 있습니다. 


10. 이미지에 대한 이해와 피드백

GPT-4는 그림 또는 이미지를 이해하고 그에 대한 피드백과 의견을 내놓을 수 있습니다. 우명한 작품일경우 그림에 대한 타이틀과 작가를 알려줄수 있습니다. 또한 그림에 대한 설명을 함께 줍니다. 여기서 더 나아가 알려지지 않은 그림을 찍어 물어보면 그림에 대한 의견이나 느낌, 화풍까지도 알려줍니다.

관련자료

전체 12 / 1 페이지
번호
제목
이름

AI 활용법

공지글


최근글