Top 18 Extension cho A1111 của Stable Diffusion Web UI năm 2023
Xem thêm:
- [Review] Midjourney vs Stable Diffusion: Công cụ nào tạo ảnh đẹp hơn?
- 10 Cách kiểm soát góc máy trong Stable Diffusion để có bức ảnh như ý năm 2023
- Lấy prompt của tất cả các loại ảnh với lệnh Describe trong Midjourney
- Hướng dẫn sử dụng Midjourney để tạo ảnh AI đẹp
- Các kỹ sư Prompt bật mí mẹo viết prompt cho ChatGPT, Midjourney, Bing Chat
- 6 chatbot AI có thể thay thế Character.AI không có bộ lọc NSFW trong năm 2023
A1111 của Stable Diffusion Web UI là một web UI rất phổ biến để truy cập vào các mô hình trí tuệ nhân tạo của Stable Diffusion mà không cần viết mã. Là giao diện dựa trên trình duyệt hàng đầu sử dụng thư viện Gradio, nó đi kèm với nhiều tính năng để cải thiện trải nghiệm người dùng và tạo ra kết quả xuất sắc. Giao diện người dùng này nổi bật với loạt tiện ích mở rộng đa dạng và sự đổi mới liên tục, điều này làm nó nổi bật so với các giao diện người dùng khác như InvokeAI. Tuy nhiên, tôi vẫn ủng hộ InvokeAI, không chỉ vì nó dễ cài đặt trên Mac M1 hoặc M2, mà còn vì giao diện người dùng và tính năng outpainting của nó rất tuyệt vời.
Nếu bạn đang tìm kiếm thông tin thêm về Stable Diffusion, hãy xem những bài viết khác mà tôi đã viết về Stable Diffusion:
Bài viết này khám phá tính năng có giá trị nhất của A1111 của Stable Diffusion Web UI: các tiện ích mở rộng.
Tiện ích mở rộng cho A1111 của Stable Diffusion Web UI
Theo quan điểm của tôi, các tiện ích mở rộng là điều làm nên sự khác biệt của giao diện web này và làm nó trở nên tuyệt vời. Mặc dù có thể có các giao diện người dùng khác tốt hơn như InvokeAI, nhưng chúng không đạt được cùng mức độ đổi mới như giao diện người dùng Automatic1111.
Tiện ích mở rộng là một tính năng bổ sung của A1111 của Stable Diffusion Web UI, khiến việc dùng tiện lợi hơn.
Chúng có thể được cài đặt dễ dàng bằng cách sử dụng giao diện người dùng web. Và tất cả các tiện ích mở rộng đều được đặt trong thư mục riêng của chúng trong thư mục tiện ích mở rộng của web UI.
Đối với người dùng nâng cao, họ cũng có thể cài đặt thủ công. Để cài đặt một tiện ích mở rộng theo cách thủ công, bạn có thể sử dụng git để sao chép nó vào thư mục tiện ích mở rộng. Ví dụ, để cài đặt một tiện ích mở rộng từ https://github.com/AUTOMATIC1111/stable-diffusion-webui-aesthetic-gradients, bạn có thể sử dụng lệnh sau: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui-aesthetic-gradients extensions/aesthetic-gradients
.
Hoặc bạn có thể sao chép và dán một thư mục vào thư mục tiện ích mở rộng. Và đối với những người quan tâm đến việc phát triển tiện ích mở rộng, có hướng dẫn để phát triển tiện ích mở rộng có sẵn.
Top 5 Tiện ích mở rộng cho A1111 của Stable Diffusion Web UI:
1. ControlNet
https://github.com/Mikubill/sd-webui-controlnet
ControlNet là một thay đổi hoàn toàn trong quy trình làm việc cá nhân của tôi, và đây là điều tuyệt nhất trong Stable Diffusion theo ý kiến của tôi.
Tiện ích mở rộng ControlNet cho phép bạn sử dụng các mô hình khác nhau như Canny, Depth, HED, OpenPose, v.v. để làm cho kết quả đầu ra phù hợp với bất kỳ đầu vào nào bạn có thể tưởng tượng. Có một giải thích tuyệt vời về cách tiện ích mở rộng này hoạt động trên Reddit.
2. Dreambooth
https://github.com/d8ahazard/sd_dreambooth_extension
Dreambooth có lẽ là một trong những tiện ích mở rộng nổi tiếng nhất. Dreambooth cho phép bạn tạo ra các mô hình tùy chỉnh và tệp kiểm tra bằng cách sử dụng tập dữ liệu của riêng bạn để sử dụng với Stable Diffusion. Bạn muốn huấn luyện khuôn mặt của mình, một đối tượng trong nhà của bạn hoặc một phong cách vào một mô hình để bạn có thể tạo ra hình ảnh với nó? Đây là tiện ích mở rộng dành cho bạn.
Bạn cũng có thể huấn luyện LORAs bằng tiện ích mở rộng này. Nếu bạn tò mò, tôi đã viết trước đây về Tùy chỉnh các mô hình Stable Diffusion với dữ liệu của riêng bạn.
3. Deforum (Animations)
https://github.com/deforum-art/deforum-for-automatic1111-webui
Deforum hữu ích để tạo ra các hoạt hình với Stable Diffusion. Đúng vậy: video, GIF và những thứ tương tự. Thật tuyệt vời khi có thể làm được những điều như vậy. Chúng không đạt đến mức của một bộ phim bom tấn hoặc một studio hoạt hình. Nhưng với một chút sáng tạo, bạn có thể tạo ra những thứ tuyệt vời!
4. Dynamic Prompts
https://github.com/adieyal/sd-dynamic-prompts
Dynamic Prompts là một tiện ích mở rộng triển khai một ngôn ngữ mẫu biểu diễn phong phú cho việc tạo ra các câu hỏi ngẫu nhiên hoặc kết hợp cùng với các tính năng hỗ trợ cấu trúc thư mục đại diện sâu.
Tôi sử dụng tiện ích mở rộng này thường xuyên để giúp tạo ra các câu hỏi và ý tưởng. Nếu bạn cảm thấy mình bị tắc nghẽn trong việc viết câu hỏi, đây có thể là tiện ích mở rộng dành cho bạn! Tôi cũng thấy rất hữu ích để lưu trữ các thuật ngữ phổ biến và tổ chức thông tin tại một nơi để giúp xây dựng câu hỏi.
Có rất nhiều tính năng thú vị khác, như attention grabber, sẽ tự động thêm sự nhấn mạnh vào các phần ngẫu nhiên của câu hỏi của bạn.
5. CLIP Interrogator
https://github.com/pharmapsychotic/clip-interrogator
Tôi sử dụng CLIP Interrogator để giúp tạo prompt. Extension chạy khá nhanh và thường cho kết quả tốt.
CLIP Interrogator là một công cụ tạom prompt kết hợp giữa CLIP của OpenAI và BLIP của Salesforce để tối ưu hóa prompt cho phù hợp với một hình ảnh cho trước.
Bạn muốn tìm hiểu câu prompt hay để tạo ra hình ảnh mới giống như một hình ảnh hiện có? Tiện ích mở rộng này có thể hữu ích cho bạn!
6. Image Browser – Trình duyệt ảnh
- Link cài extension:
https://github.com/AlUlkesh/stable-diffusion-webui-images-browser
Bạn có nhiều hình ảnh. Muốn tìm những hình ảnh cũ hơn? Thay vì sử dụng File Explorer (Windows) hoặc Finder (Mac), bạn có thể xem ảnh trực tiếp trong AUTOMATIC1111 bằng cách sử dụng Trình duyệt ảnh. Ngoài ra, bạn cũng có thể tìm kiếm hình ảnh dựa trên các gợi ý và mô hình.
Mặc dù rất hữu ích, giao diện người dùng của tiện ích mở rộng Trình duyệt ảnh cần được cải thiện. Một tùy chọn mới là Infinite Image Browser.
7. Canvas Zoom
- Link cài extension:
https://github.com/richrobber2/canvas-zoom
Bạn thấy bề mặt vẽ inpainting quá nhỏ phải không? Hãy sử dụng extension này để dễ dàng phóng to và điều chỉnh kích thước bút vẽ bằng các phím tắt trên bàn phím. Điều này rất hữu ích khi xử lý các chi tiết trong các khu vực nhỏ.
Ultimate SD Upscale
- Hướng dẫn
- Link cài extension::
https://github.com/Coyote-A/ultimate-upscale-for-automatic1111
Độ phân giải tốt nhất cho Stable Diffusion v1 là 512 pixel trên một cạnh. Ultimate SD Upscale cho phép bạn phóng to hình ảnh bằng ControlNet. Điều này rất hữu ích nếu bạn không có một GPU card với VRAM lớn.
8. After Detailer
- Hướng dẫn
- Link cài extension:
https://github.com/Bing-su/adetailer
After Detailer tự động sửa chữa khuôn mặt và tay. Nó tăng khả năng có được một hình ảnh tốt.
9. Regional Prompter
- Hướng dẫn
- Link cài extension:
https://github.com/hako-mikan/sd-webui-regional-prompter
Regional Prompter cho phép bạn chia một hình ảnh thành các phần và đặt các gợi ý duy nhất cho mỗi phần. Công cụ này cung cấp tính linh hoạt tuyệt vời: bạn có thể định vị các đối tượng một cách chính xác và chọn màu sắc cụ thể cho các phần của hình ảnh mà không làm thay đổi phần còn lại.
10. Trình chỉnh sửa dáng người OpenPose
Link cài extension:
https://github.com/fkunn1326/openpose-editor
Trình chỉnh sửa OpenPose cho phép bạn chỉnh sửa hình ảnh từ preprocessor Openpose của ControlNet. Bây giờ bạn có thể điều chỉnh tư thế một cách chính xác khi sử dụng ControlNet.
11. Civitai Helper
Link cài extension:
https://github.com/butaixianran/Stable-Diffusion-Webui-Civitai-Helper
Nếu bạn sử dụng Stable Diffusion, có lẽ bạn đã tải xuống một mô hình từ Civitai. Nhưng bạn phải đặt các mô hình checkpoint, LoRA và textual inversion vào các thư mục đúng. Civitai Helper cho phép bạn tải xuống các mô hình từ Civitai ngay trong giao diện AUTOMATIC1111.
Lợi ích phụ: hình ảnh bìa của các mô hình sẽ được tải xuống. Sử dụng nút Scan để tải xuống hình ảnh của các mô hình hiện có.
12. Roop
Link cài extension:
https://github.com/s0md3v/sd-webui-roop
Roop là một tiện ích mở rộng dễ sử dụng để hoán đổi khuôn mặt. Bạn có thể sử dụng nó với văn bản thành hình ảnh hoặc hình ảnh thành hình ảnh.
Ảnh gốc
Ảnh thay mặt bằng Roop
13. Style Selector for SDXL 1.0
Link cài extension:
https://github.com/ahgsql/StyleSelectorXL
Style Selector for SDXL là một tiện ích mở rộng tiện lợi cho phép bạn thêm các từ khóa và câu hỏi phủ định để đạt được các phong cách cụ thể. Các phong cách có sẵn giống như trong DreamStudio, trình tạo hình ảnh chính thức của Stable Diffusion.
14. Aspect Ratio selector
Link cài extension:
https://github.com/alemelis/sd-webui-ar
Aspect Ratio Selector: Phần mở rộng này giúp bạn chọn tỷ lệ khung hình một cách dễ dàng mà không cần nhớ các số pixel tương ứng. Bạn chỉ cần nhấp chuột một lần để chọn kích thước hình ảnh phù hợp. Bạn cũng có thể tạo các thiết lập trước định nghĩa bằng cách chỉnh sửa tệp resolutions.txt
trong thư mục của phần mở rộng. Dưới đây là các thiết lập mà tôi sử dụng:
SD1:1, 512, 512 # 1:1 vuông
SD3:2, 768, 512 # 3:2 ngang
XL1:1, 1024, 1024
XL5:4, 1152, 896
XL3:2, 1216, 832
XL16:9, 1344, 768
XL21:9, 1536, 640
15. AnimateDiff:
Đây là một phần mở rộng cho phép bạn tạo video ngắn bằng cách sử dụng prompt với bất kỳ mô hình Stable Diffusion nào. Bạn có thể tìm hiểu thêm thông qua hướng dẫn và tải phần mở rộng tại địa chỉ sau:
https://github.com/continue-revolution/sd-webui-animatediff
16. text2video:
https://github.com/continue-revolution/sd-webui-animatediff
Đây là một phần mở rộng cho phép bạn tạo video bằng cách sử dụng mô hình ModelScope. Bạn có thể tìm hiểu thêm thông qua hướng dẫn và tải phần mở rộng tại địa chỉ sau:
https://github.com/kabachuha/sd-webui-text2video
17. Mov2mov:
Đây là một phần mở rộng đơn giản cho phép bạn tạo hiệu ứng cho video bằng bất kỳ mô hình Stable Diffusion nào. Bạn có thể tìm hiểu thêm thông qua hướng dẫn và tải phần mở rộng tại địa chỉ sau:
https://github.com/Scholar01/sd-webui-mov2mov
18. Temporal Kit:
Đây là một phần mở rộng hỗ trợ sử dụng EbSynth, một ứng dụng cho phép bạn tạo hiệu ứng cho video từng khung hình một. Nhờ Stable Diffusion, bạn có thể tự động tô màu các khung hình chính, làm cho EbSynth trở nên phổ biến hơn trước đây. Bạn có thể tìm hiểu thêm thông qua hướng dẫn và tải phần mở rộng tại địa chỉ sau:
https://github.com/CiaraStrawberry/TemporalKit
Tuy việc sử dụng phần mở rộng này có một số công việc phức tạp, nhưng nó mang lại kết quả tốt nhất.
Các tiện ích mở rộng khác
Đây là 5 tiện ích mở rộng yêu thích của tôi. Còn rất nhiều tiện ích khác! Xem danh sách đầy đủ tại đây: https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Extensions
A1111 của Stable Diffusion Web UI là một công cụ mạnh mẽ cho bất kỳ ai muốn sử dụng các mô hình trí tuệ nhân tạo mà không cần viết mã. Sự đa dạng về tiện ích mở rộng, sự đổi mới liên tục và giao diện người dùng thân thiện làm cho nó trở thành một lựa chọn nổi bật trong lĩnh vực này. Tôi vẫn mạnh mẽ ủng hộ InvokeAI, nhưng các tiện ích mở rộng trên đây đáng để có một bản sao của giao diện người dùng này để sử dụng cùng với nó trên máy tính của bạn.—END NOTE—