Bing có thể sớm có khả năng sử dụng hình ảnh, video, các loại dữ liệu khác trong phản hồi

Biểu tượng thời gian đọc 3 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Sản phẩm Bing hỗ trợ ChatGPT mới đang liên tục cải thiện và Microsoft có thể bắt đầu bước phát triển lớn nhất vào tuần tới. Andreas Braun, CTO của Microsoft Đức, gần đây đã thông báo rằng GPT-4 sẽ ra mắt vào tuần tới. Bên cạnh đó, giám đốc điều hành còn gợi ý về “các mô hình đa phương thức sẽ mang đến những khả năng hoàn toàn khác”.

Microsoft đã đầu tư hàng tỷ đô la vào các sáng kiến ​​AI của mình, đặc biệt là trong việc không ngừng cải tiến Bing để cạnh tranh tốt hơn với Google. Giờ đây, gã khổng lồ phần mềm đã xác nhận sự xuất hiện của GPT-4 vào tuần tới, dự kiến ​​sẽ được đưa vào công cụ tìm kiếm và chatbot của họ.

Trước khi phát hành ChatGPT Bing, đã có tin đồn về Bing sử dụng GPT-4. Tuy nhiên, thay vào đó, Microsoft đã sử dụng mô hình GPT-3.5 cùng với công nghệ độc quyền của mình Prometheus, cho phép Bing tạo dữ liệu cập nhật. Đáng ngạc nhiên, mặc dù Bing mới vẫn chưa có sẵn cho tất cả mọi người, nhưng công ty đã có kế hoạch cung cấp cho công cụ tìm kiếm một sự thúc đẩy đáng kể thông qua GPT-4 sắp tới.

Mô hình ngôn ngữ lớn mới và sắp ra mắt của OpenAI dự kiến ​​sẽ cho phép chatbot Bing tạo ra kết quả nhanh hơn, đây có thể là một trợ giúp rất lớn vì phiên bản hiện tại thường mất vài giây để bắt đầu tạo phản hồi. Tuy nhiên, ngoài tốc độ, khả năng đa phương thức có thể là điều lớn nhất mà việc giới thiệu LLM mới có thể mang lại.

Tại sự kiện AI in Focus – Digital Kickoff của Microsoft, Braun đã chia sẻ một số thông tin chi tiết về những điều có thể mong đợi khi bắt đầu một LLM mới. (thông qua Heise)

“Chúng tôi sẽ giới thiệu GPT-4 vào tuần tới, ở đó chúng tôi sẽ có các mô hình đa phương thức cung cấp các khả năng hoàn toàn khác nhau – ví dụ như video,” Braun cho biết, người đã mô tả LLM là “người thay đổi cuộc chơi”.

Hơn nữa, Braun xác nhận rằng Microsoft có kế hoạch “làm cho các mô hình trở nên toàn diện” bằng cách sử dụng khả năng đa phương thức. Sau khi được đưa vào, điều này sẽ cho phép Bing cung cấp nhiều loại dữ liệu khi trả lời các câu hỏi, nghĩa là nó cũng có thể xử lý video, hình ảnh và các loại dữ liệu khác. Điều này sẽ mang lại phản hồi tốt hơn, giúp Bing trở thành trợ lý tìm kiếm hiệu quả hơn cho mọi người.

Mặt khác, điều quan trọng cần lưu ý là Bing không phải là ứng dụng đa phương thức đầu tiên. Gần đây, bạn.com triển khai tính năng tìm kiếm trò chuyện đa phương thức, cho phép người dùng cung cấp đầu vào bằng văn bản và giọng nói, đồng thời nhận phản hồi ngoài văn bản hội thoại. Tuy nhiên, công cụ tìm kiếm vẫn đang phải vật lộn để thu hút sự chú ý từ công chúng. Trong khi đó, mặc dù vẫn chưa được tất cả mọi người truy cập đầy đủ, Bing đã có một danh sách chờ liên tục mở rộng. Việc đưa khả năng đa phương thức vào nó chắc chắn sẽ ảnh hưởng đến các đối thủ của nó, chẳng hạn như You.com.Tuy nhiên, vẫn còn sớm để nói mức độ ảnh hưởng này sẽ lớn như thế nào vì thông báo của Braun chỉ xác nhận rất ít chi tiết.

Thông tin thêm về các chủ đề: ai, ChatGPT, GPT-4, Microsoft cạnh, mởAI