Công cụ AI

11 cách sử dụng hiệu quả GPT-4 vision để đọc thông tin hình ảnh

Xem thêm:

11 creative ways to use GPT-4's vision features in ChatGPT

Tạo giao diện web từ phác thảo vẽ tay

GPT-4V có thể tái tạo giao diện trang web từ ảnh chụp màn hình hoặc bản vẽ, giúp rút ngắn thời gian phát triển từ thiết kế đến nguyên mẫu.

Công cụ AI dường như bắt chước cấu trúc đã cho gần như hoàn hảo, thậm chí lấy dữ liệu từ mẫu 1: 1 làm khung hình (placeholder). Chỉ có các chi tiết thiết kế như màu sắc, hình dạng và phông chữ là khác nhau. Tuy nhiên, GPT-4V có thể rút ngắn đáng kể thời gian phát triển từ thiết kế đến nguyên mẫu trong lĩnh vực này.


Video: @mckaywrigley/Twitter

Matt Shumer, Giám đốc điều hành của công ty khởi nghiệp AI HyperWrite, đã tiến một bước xa hơn và kết hợp GPT-4V với khái niệm AutoGPT. Ở đây, AI sử dụng kết quả của một lần chạy làm lời nhắc cho lần chạy tiếp theo, cho phép nó liên tục tự cải thiện mã.


Video: @mattshumer_/Twitter

Giải thích truyện tranh, meme hoặc infographics

Giải thích truyện tranh, meme hoặc infographics: GPT-4V có thể giải thích nội dung của hình ảnh, bao gồm cả chú thích và giải thích về lý do hình ảnh có thể được hiểu là hài hước.

Twitter: @skirano/Twitter

Bild: @rcweston/Twitter

Hỗ trợ việc làm bài tập

GPT-4V có thể giúp giải thích các thông tin phức tạp trong đồ họa hoặc chuyển đổi chúng thành các giải thích văn bản đơn giản.

Như Mckay Wrigley đã demo trên Twitter, GPT-4V có thể dễ dàng phân tích cú pháp kể cả cú pháp trong các infographics phức tạp như việc ghi chú thông tin về các tế bào trong cơ thể con người. Trong ví dụ của mình, anh ấy giải thích tế bào ở trình độ học sinh lớp chín và có thể trả lời câu hỏi sâu hơn.

Video: @mckaywrigley/Twitter

Mô hình cũng có thể chia nhỏ infographics thành các giải thích văn bản đơn giản, như Muratcan Koylan minh họa.

Image: Muratcan Koylan / @youraimarketer

Tư vấn thiết kế nội thất hoặc tạo hình ảnh hiệu ứng của nấm gây ảo giác

GPT-4V có thể xử lý ảnh và tạo ra các hình ảnh mới. Ví dụ, người dùng có thể hỏi GPT-4V về cảm giác sau khi ăn nấm gây ảo giác và nhận được mô tả và hình ảnh tương ứng.

Ngoài đồ họa, GPT-4V cũng có thể xử lý ảnh hoặc hình ảnh do AI tạo ra. Trong ví dụ này, người dùng Twitter Pietro Schirano đã cung cấp hình ảnh AI và yêu cầu ChatGPT đặt tên cho phong cách nội thất này, AI đã nhanh chóng đưa ra lời giải thích hợp lý.

Image: @skirano/Twitter

Schirano nhấn mạnh tiềm năng của AI được cá nhân hóa với một ví dụ khác. Anh ấy đã lưu trữ một số thông tin về bản thân trong các hướng dẫn tùy chỉnh, được ChatGPT sử dụng khi đánh giá nội thất của anh ấy.

Image: @skirano/Twitter

Ví dụ sau đây cho thấy sự kết hợp thú vị giữa hình ảnh đầu vào, mô tả hình ảnh và hình ảnh đầu ra: Người dùng Twitter Pietro Schirano lần đầu tiên cho GPT-4V xem một bức ảnh về nấm ảo giác. Không nói cho AI biết chúng là nấm gì, anh ta hỏi GPT-4V cảm giác thế nào sau khi ăn nấm.

Image: @skirano/Twitter

Hệ thống cung cấp một mô tả phù hợp và sau đó mô tả bằng hình ảnh ảo giác bằng công cụ DALL-E 2.

Image: Pietro Schirano / @skirano

Với sự ra mắt của [DALL-E 3]([Review] DALL-E 3, công cụ tạo ảnh AI miễn phí của ChatGPT – AI Frontier) vào tháng 10 cho tất cả người dùng trả phí trong ChatGPT, quy trình tạo ảnh này sẽ có thể được thực hiện trực tiếp trong ChatGPT Plus với [chất lượng cao hơn nhiều](DALL-E 3 của ChatGPT Đe Dọa MidJourney nhờ các tính năng mới – AI Frontier).

Giải mã chữ viết không rõ

OCR (Nhận dạng ký tự quang học) chỉ là một phần nhỏ của GPT-4V nhưng khả năng của nó là rất lớn. Các nhà sử học nên biết rằng GPT-4V có thể giải mã và dịch các bản thảo lịch sử. Nhà nghiên cứu Ethan Mollick cho biết: “Nhân loại sắp thay đổi một cách lớn lao”, sau khi sử dụng GPT-4V để chuyển đổi, dịch và phân tích các ghi chú cách đây nhiều thế kỷ của Robert Hooke.

Image: Ethan Mollick

Image: Ethan Mollick

Cách đăng ký GPT-4V?

Để sử dụng GPT-4V, người dùng cần đăng ký gói ChatGPT-Plus với giá 20 đô la mỗi tháng. Sau đó, họ có thể tải lên ảnh thông qua trang web hoặc ứng dụng di động. Hiện tại, OpenAI đang triển khai GPT-4V theo từng giai đoạn, vì vậy ngay cả khi bạn đã có gói thành viên trả phí, bạn có thể chưa có quyền truy cập vào tính năng này.

Hoàng Dũng AI

AI Trainer and Automation Specialist | Passionate about Empowering Individuals with AI Skills.