Công cụ AI

[Review] Midjourney vs Stable Diffusion: Công cụ nào tạo ảnh đẹp hơn?

Xem thêm

Bạn đang muốn tạo ra các hình ảnh giống như thật? Dưới đây là 2 công cụ AI bạn nên sử dụng. Trong các công cụ tạo hình ảnh, chắc bạn đã nghe nói về cuộc đối đầu giữa MidjourneyStable Diffusion. Cả hai công cụ tạo hình ảnh AI này đều tốt. Sự khác biệt là ở khả năng tùy chỉnh, phong cách nghệ thuật, mức độ dễ sử dụng, chi phí… Vì vậy, trong bài viết này, chúng ta hãy xem những điểm khác nhau giữa hai công cụ này và bạn quyết định nên sử dụng công cụ nào.

ĐÁP ÁN NHANH

Nếu bạn đang vội, đây là tóm tắt nhanh về sự khác biệt giữa Midjourney và Stable Diffusion:

  • Midjourney sử dụng mô hình học máy độc quyền, trong khi Stable Diffusion có mã nguồn mở miễn phí.
  • Bạn có thể tải và chạy Stable Diffusion trên máy tính, miễn là máy tính đáp ứng yêu cầu. Midjourney chỉ có thể sử dụng khi kết nối internet.
  • Bạn chỉ có thể truy cập Midjourney thông qua ứng dụng trò chuyện Discord. Trong khi đó, bạn có thể sử dụng Stable Diffusion qua nhiều ứng dụng trực tuyến và ngoại tuyến khác nhau.
  • Midjourney có giá tối thiểu là 10 đô la mỗi tháng nhưng số hình ảnh bị giới hạn. Bạn có thể chạy Stable Diffusion trên phần cứng của mình miễn phí hoặc trả một khoản phí nhỏ cho dịch vụ trực tuyến.
  • Bạn có thể sử dụng Stable Diffusion để điền vào hoặc chỉnh sửa chỉ một số phần của hình ảnh. Đến tháng 6 năm 2023, Midjourney cũng đã tích hợp tính năng inpainting và outpainting thông qua nút Zoom Out.
  • Stable Diffusion hỗ trợ hàng ngàn mô hình tùy chỉnh có thể tải về, trong khi bạn chỉ có một số lượng nhỏ để lựa chọn với Midjourney.
  • Midjourney có vẻ dễ sử dụng hơn vì nó có ít tùy chỉnh hơn so với Stable Diffusion. Tuy nhiên, Stable Diffusion cung cấp nhiều tính năng nâng cao và tùy chỉnh hơn.

Hãy đọc tiếp để tìm hiểu thêm về sự khác biệt giữa Midjourney và Stable Diffusion. Chúng ta cũng sẽ so sánh cùng một prompt để xem công cụ nào tốt hơn.

Midjourney và Stable Diffusion: Sự khác biệt là gì?

Nếu bạn mới nghe về Midjourney hoặc Stable Diffusion gần đây là vì các công cụ tạo hình ảnh AI này mới ra mắt vào giữa năm 2022. Midjourney là dịch vụ trả phí còn Stable Diffusion là phần mềm mã nguồn mở nên miễn phí.

Do tính chất mã nguồn mở nên Stable Diffusion đã trở thành một trong những công cụ tạo hình ảnh có khả năng tùy chỉnh cao nhất và phổ biến nhất. Bạn có thể sử dụng phiên bản cơ bản của nó trực tuyến, miễn phí hoặc qua đăng ký trả phí. Nhưng nếu bạn muốn chỉnh sửa và đạt được kết quả tốt nhất, có lẽ bạn nên tạo hình ảnh trên máy tính riêng của mình.

Phần mềm giao diện người dùng (frontend) như Stable Diffusion Web UI cung cấp nhiều tính năng nâng cao và cho phép bạn sử dụng các mô hình nghệ thuật tùy chỉnh. Nhược điểm là việc thiết lập mất một số thời gian và đòi hỏi chút kỹ thuật.

Midjourney dễ sử dụng hơn, nhưng Stable Diffusion cung cấp đủ lựa chọn cho cả người mới bắt đầu và người dùng có kinh nghiệm.

Còn Midjourney thì dễ sử dụng hơn. Chúng tôi có một hướng dẫn riêng về cách sử dụng Midjourney, nhưng bạn chỉ cần truy cập công cụ này thông qua ứng dụng trò chuyện Discord. Về tùy chỉnh thì bạn chỉ cần bổ sung thêm một vài tham số vào câu lệnh của mình. Còn chất lượng thực sự của hình ảnh thì sao? Chất lượng của cả hai công cụ tạo hình ảnh AI khá đồng  đều. Tuy nhiên, mô hình V5 mới nhất của Midjourney tạo ra những hình ảnh chất lượng cao khớp với câu lệnh. Vì vậy, về khía cạnh dễ sử dụng, nó có một chút lợi thế. Nhưng nếu bạn sẵn lòng bỏ thời gian chỉnh sửa đầu vào và điều chỉnh cài đặt, Stable Diffusion cũng có thể bằng hoặc thậm chí vượt qua kết quả của Midjourney.

Midjourney vs Stable Diffusion: Tính năng

Midjourney vs Stable Diffusion: Tính năng

Thoạt nhìn, Midjourney và Stable Diffusion có vẻ  có cùng tính năng. Tuy nhiên, cả hai công cụ tạo hình ảnh này đều có những ưu điểm và nhược điểm riêng.

Ví dụ, việc tăng độ phân giải trước đây có thể được thực hiện bằng cách sử dụng các nút U1, U2, U3 và U4 trong Midjourney. Nhưng giờ đây, phiên bản mới nhất của Midjourney không hỗ trợ việc tăng độ phân giải. Trái lại, Stable Diffusion nhờ có tính chất mã nguồn mở, cho phép bạn tải xuống nhiều mô hình tăng độ phân giải khác nhau để thử nghiệm. Và nếu máy tính của bạn có đủ bộ nhớ video, bạn cũng có thể tạo ra hình ảnh có độ phân giải cao hơn giới hạn hiện tại của Midjourney là một mega pixel.

Dưới đây là một số khác biệt về tính năng khác giữa Midjourney và Stable Diffusion:

  • Inpainting và outpainting: Với Stable Diffusion, bạn có thể sử dụng inpainting để điều chỉnh một số phần của hình ảnh. Tương tự, outpainting cho phép bạn tạo ra các chi tiết mới nằm ngoài ranh giới của hình ảnh hiện có. Midjourney đã thêm các tính năng chỉnh sửa này thông qua nút Zoom Out mới dưới mỗi lần tạo ra hình ảnh. Nhưng nếu bạn muốn có nhiều kiểm soát hơn, tôi khuyến khích bạn nên tìm đến tính năng Generative Fill mới của Photoshop thay vì sử dụng Midjourney.
  • Lệnh tạo hình ảnh: Bạn có thể tải lên một hoặc hai hình ảnh lên Midjourney. Bot sẽ kết hợp hình ảnh đó với văn bản của bạn để tạo ra bức ảnh giống bức ảnh tải lên.
  • Tùy chỉnh phong cách nghệ thuật: Midjourney cung cấp một mô hình được tối ưu hóa cho truyện tranh anime bạn có thể gọi ra bằng cách sử dụng tham số –niji. Tuy nhiên, Stable Diffusion cho phép bạn tải xuống các mô hình tùy chỉnh được đào tạo trên nhiều phong cách nghệ thuật, từ chân thực đến hoa giấy.
  • Kiểm duyệt: Trong khi các mô hình Stable Diffusion cơ bản chính thức không cho phép bạn tạo ra hình ảnh không phù hợp, bạn có thể vượt qua giới hạn này nhờ sử dụng các mô hình tùy chỉnh. Điều này không thể thực hiện được với Midjourney và bạn có thể bị treo tài khoản nếu các prompt của bạn chứa nội dung hoặc ngôn từ không phù hợp.

Hãy nhớ rằng bạn sẽ phải sử dụng Stable Diffusion trên phần cứng của bạn để tận dụng các lợi ích của nó. Các công cụ trực tuyến không cung cấp mức độ linh hoạt như vậy.

Midjourney vs Stable Diffusion: Chi phí

Midjourney vs Stable Diffusion: Chi phí

Là một công ty nên không có gì ngạc nhiên khi Midjourney áp đặt một số hạn chế về tần suất sử dụng. Ngay cả khi bạn đã trả tiền để sử dụng Midjourney, số giờ tạo ảnh mỗi tháng của bạn bị giới hạn. Các gói từ 30 đô la trở lên mới cung cấp giờ làm việc không giới hạn ở chế độ relax, nhưng điều đó có nghĩa là bạn phải chờ đợi một vài phút cho mỗi bức ảnh. Hơn nữa, không có gói miễn phí hoặc thời gian dùng thử nào.

Stable Diffusion hoạt động theo cách ngược lại hoàn toàn. Bạn có thể tải miễn phí phần mềm mã nguồn mở này, tuy nhiên, bạn sẽ cần một máy tính có cấu hình mạnh với card đồ họa riêng. Hầu hết các mô hình đòi hỏi ít nhất 4GB VRAM, vì vậy một máy tính chơi game hiện đại phù hợp với yêu cầu này. Nhưng nếu bạn chưa sở hữu một máy tính như vậy, phần cứng như thế có thể dễ dàng tốn hơn một ngàn đô la. May mắn thay, bạn có thể sử dụng Stable Diffusion trực tuyến hoặc thậm chí trong một máy ảo trên đám mây như Google Colab nếu muốn.

Bạn có thể sử dụng Stable Diffusion miễn phí, nhưng sẽ hơi mất công.

Đáng lưu ý là những người tạo ra Stable Diffusion cũng cung cấp một ứng dụng tạo ảnh trực tuyến có tên là DreamStudio. Sử dụng khá dễ nhưng giống như Midjourney, mất phí. Tuy nhiên, giá thấp hơn khá nhiều, với 10 đô la, bạn được 1.000 credits. Bạn cũng có thể dùng thử miễn phí vì tất cả các tài khoản mới đều được tặng 25 credit khi đăng ký.

Nếu bạn đang tìm kiếm một sự lựa chọn hoàn toàn miễn phí và dễ sử dụng, tôi khuyến nghị xem xét một lựa chọn thứ ba như Bing Image Creator. Tuy nhiên, Bing sử dụng mô hình DALL-E 2 của OpenAI hoàn toàn không liên quan đến Stable Diffusion hoặc Midjourney.

Midjourney vs Stable Diffusion: Nên dùng công cụ nào?

DreamStudio

Hãy xem một số ví dụ thực tế để xem bộ tạo ảnh trí tuệ nhân tạo nào xuất sắc hơn. Trong so sánh này, tôi sẽ sử dụng DreamStudio để tạo ảnh thông qua Stable Diffusion vì nó dễ sử dụng như Midjourney. Tôi có thể có kết quả tốt hơn nếu dùng các mô hình tùy chỉnh, nhưng việc này sẽ đòi hỏi nhiều công sức hơn. Vì vậy, để đảm bảo công bằng, hãy so sánh trải nghiệm bấm một lần của Midjourney và Stable Diffusion.

Hình ảnh đầu tiên được tạo ra với lệnh đơn giản: “Star Wars’ Darth Vader, nhưng là cyberpunk”. Tôi nghĩ cả hai bộ tạo ảnh đều làm rất tốt với thông tin hạn chế được cung cấp, ngay cả khi đây là hai cách tiếp cận khác nhau.

Midjourney vs Stable Diffusion

Lệnh tiếp theo rõ ràng thể hiện một trong những điểm mạnh của Midjourney: tính hiện thực. Nếu bạn muốn tạo ra những hình ảnh giống như thật, Midjourney thường sẽ có được kết quả tốt hơn so với hầu hết các bộ tạo ảnh trí tuệ nhân tạo khác. Trong khi ảnh của Stable Diffusion khớp với tất cả các yếu tố trong lệnh, nó không thể đáp ứng được phần “ảnh giống như thật” (“photorealistic”).

Midjourney vs Stable Diffusion: realism

Ví dụ cuối cùng, hãy xem cách hai công cụ tạo ảnh xử lý các lệnh về thể loại huyền thoại. Tôi nhập lệnh yêu cầu một con rồng trắng to mọc trên một tảng đá, ngắm cảnh chân trời. Một lần nữa, rõ ràng là Midjourney có thể tạo ra chi tiết phức tạp hơn. Tuy nhiên, nếu bạn nhìn kỹ vào phía dưới của hình ảnh, bạn sẽ thấy một dãy chữ lung tung, đó là Midjourney chữ đánh dấu bản quyền trong dữ liệu huấn luyện của nó.

Midjourney vs Stable Diffusion

Cần nhắc lại rằng người dùng trình độ cao có thể tạo được hình ảnh tốt hơn từ Stable Diffusion so với các ví dụ được trình bày ở đây. Tuy nhiên, khi so sánh hai tùy chọn dễ sử dụng nhất, tôi đã thấy rằng Midjourney thường mang lại kết quả tốt hơn cho cùng một lệnh đầu vào. Bạn thích công cụ tạo ảnh trí tuệ nhân tạo nào hơn?

Hoàng Dũng AI

AI Trainer and Automation Specialist | Passionate about Empowering Individuals with AI Skills.