Azure OpenAI 서비스를 통해 Vision과 함께 GPT-4 Turbo를 사용할 수 있는데 Gemini Ultra를 기다리는 이유는 무엇입니까?

독서 시간 아이콘 2 분. 읽다


독자들은 MSpoweruser를 지원하는 데 도움을 줍니다. 당사의 링크를 통해 구매하시면 수수료를 받을 수 있습니다. 툴팁 아이콘

공개 페이지를 읽고 MSPoweruser가 편집팀을 유지하는 데 어떻게 도움을 줄 수 있는지 알아보세요. 자세히 보기

OpenAI GPT-4 터보와 Gemini Ultra 비교

OpenAI 비전 기능이 탑재된 GPT-4 터보 이미지를 분석하고 이미지에 대한 질문에 대한 텍스트 응답을 제공할 수 있는 LMM(대형 다중 모드 모델)입니다. 이 고급 다중 모드 AI 모델은 GPT-4 Turbo의 모든 기능을 포함하는 동시에 이미지 입력을 처리하고 분석하는 기능도 추가합니다. 

오늘은 마이크로소프트 발표 이제 Azure OpenAI 서비스를 통해 Vision이 포함된 GPT-4 Turbo를 사용할 수 있습니다. 호주 동부, 스웨덴 중부, 스위스 북부 및 미국 서부 Azure 지역의 기존 Azure OpenAI 서비스 고객은 이제 Vision 서비스를 통해 GPT-4 Turbo에 액세스할 수 있습니다.

Vision이 포함된 GPT-4 Turbo의 가용성과 함께 Microsoft는 고급 기능을 지원하는 Azure AI 서비스에 대한 다음과 같은 개선 사항을 발표합니다.

  • 광학 문자 인식(OCR): 이미지에서 텍스트를 추출하고 이를 사용자의 프롬프트 및 이미지와 통합하여 맥락을 풍부하게 합니다. 
  • 객체 접지: 이미지 내의 주요 개체를 식별하고 개요를 표시하여 GPT-4 Turbo with Vision의 텍스트 응답을 향상시킵니다. 
  • 비디오 프롬프트: Vision이 포함된 GPT-4 Turbo는 사용자의 프롬프트에 따라 비디오에서 가장 관련성이 높은 프레임을 사용하여 질문에 답할 수 있습니다. 
  • 이미지가 포함된 데이터에 대한 Azure OpenAI 서비스: GPT-4 Turbo를 Vision, Azure AI Search 및 Azure AI Vision과 결합하면 이제 이미지에 텍스트 데이터를 추가할 수 있고, 벡터 검색을 활용하여 사용자 데이터와 연결하는 솔루션을 개발하여 향상된 채팅 경험을 가능하게 합니다.

Azure OpenAI 서비스의 Vision이 포함된 GPT-4 Turbo는 입력 및 출력 토큰 수에 따라 요금이 청구됩니다. 아래에서 세부정보를 찾아보세요.

모델입력 산출 
비전 기능이 탑재된 GPT-4 터보10.01개당 $10000.03개당 $1000
+ 향상된 OCR 추가 기능거래 1.50건당 $1000
+ 객체 접지를 위한 향상된 추가 기능거래 1.50건당 $1000
+ "이미지 추가" 이미지 삽입을 위한 향상된 추가 기능거래 0.10건당 $1000
+ 비디오 검색을 통합한 비디오 프롬프트용 향상된 추가 기능인덱싱의 경우 분당 0.05달러트랜잭션 0.25개당 1000달러2

이번 주 초 마이크로소프트 연구팀은 공개 새로운 프롬프트 기술을 사용하면 OpenAI의 GPT-4 모델이 Google Gemini Ultra를 능가할 수 있습니다. 따라서 Gemini Ultra를 기다리고 계시다면 반드시 Vision이 포함된 GPT-4 Turbo를 사용해 보시기 바랍니다.

주제에 대한 추가 정보: 비전 기능이 탑재된 GPT-4 터보, 마이크로 소프트, 오픈AI