Tạo hình ảnh

Trước khi bắt đầu

Trước khi gọi Gemini API, hãy đảm bảo bạn đã cài đặt SDK mà bạn chọn và khoá Gemini API đã được định cấu hình và sẵn sàng sử dụng.

Đọc thêm

Tạo hình ảnh bằng Gemini

Gemini 2.0 Flash Experimental hỗ trợ khả năng xuất văn bản và hình ảnh cùng dòng. Điều này cho phép bạn sử dụng Gemini để chỉnh sửa hình ảnh theo cách trò chuyện hoặc tạo đầu ra có văn bản đan xen (ví dụ: tạo một bài đăng trên blog có văn bản và hình ảnh trong một lượt). Tất cả hình ảnh được tạo đều có hình mờ SynthID và hình ảnh trong Google AI Studio cũng có hình mờ hiển thị.Ví dụ sau đây cho thấy cách sử dụng Gemini 2.0 để tạo đầu ra văn bản và hình ảnh:Tuỳ thuộc vào câu lệnh và ngữ cảnh, Gemini sẽ tạo nội dung ở nhiều chế độ (văn bản sang hình ảnh, văn bản sang hình ảnh và văn bản, v.v.). Dưới đây là một số ví dụ:

Đọc thêm

Chỉnh sửa hình ảnh bằng Gemini

Để chỉnh sửa hình ảnh, hãy thêm hình ảnh làm dữ liệu đầu vào. Ví dụ sau đây minh hoạ cách tải hình ảnh được mã hoá base64 lên. Đối với nhiều hình ảnh và tải trọng lớn hơn, hãy kiểm tra phần đầu vào hình ảnh.

Đọc thêm

Các điểm hạn chế

Đọc thêm

Chọn một mô hình

Bạn nên sử dụng mô hình nào để tạo hình ảnh? Điều này phụ thuộc vào trường hợp sử dụng của bạn.Gemini 2.0 phù hợp nhất để tạo hình ảnh phù hợp theo ngữ cảnh, kết hợp văn bản và hình ảnh, kết hợp kiến thức về thế giới và suy luận về hình ảnh. Bạn có th...

Đọc thêm

Tạo hình ảnh bằng Imagen 3

API Gemini cung cấp quyền truy cập vào Imagen 3, mô hình chuyển văn bản thành hình ảnh có chất lượng cao nhất của Google, với một số tính năng mới và cải tiến. Imagen 3 có thể làm những việc sau:Hiện tại, Imagen chỉ hỗ trợ câu lệnh bằng tiếng Anh và các thông số sau:

Đọc thêm

Tham số mô hình Imagen

(Quy ước đặt tên khác nhau tuỳ theo ngôn ngữ lập trình.)

Đọc thêm

Hướng dẫn về câu lệnh Imagen

Phần này của hướng dẫn về Imagen cho bạn biết cách sửa đổi câu lệnh chuyển văn bản sang hình ảnh có thể tạo ra nhiều kết quả khác nhau, cùng với ví dụ về hình ảnh bạn có thể tạo.

Đọc thêm

Kiến thức cơ bản về cách viết câu lệnh

Câu lệnh hay phải mang tính mô tả và rõ ràng, đồng thời sử dụng các từ khoá và đối tượng sửa đổi có ý nghĩa. Hãy bắt đầu bằng cách suy nghĩ về chủ đề, ngữ cảnh và phong cách.Sau khi viết phiên bản đầu tiên của câu lệnh, hãy tinh chỉnh câu lệnh bằng cách...

Đọc thêm

Tạo văn bản trong hình ảnh

Imagen có thể thêm văn bản vào hình ảnh, mở ra nhiều khả năng tạo hình ảnh sáng tạo hơn. Hãy làm theo hướng dẫn sau để khai thác tối đa tính năng này:

Đọc thêm

Tham số hoá lời nhắc

Để kiểm soát tốt hơn kết quả đầu ra, bạn nên tham số hoá dữ liệu đầu vào vào Imagen. Ví dụ: giả sử bạn muốn khách hàng có thể tạo biểu trưng cho doanh nghiệp của họ và bạn muốn đảm bảo biểu trưng luôn được tạo trên nền màu đồng nhất. Bạn cũng muốn giới hạn các tuỳ chọn mà ứng dụng có thể chọn trong trình đơn.Trong ví dụ này, bạn có thể tạo một lời nhắc có tham số tương tự như sau:Trong giao diện người dùng tuỳ chỉnh, khách hàng có thể nhập các tham số bằng trình đơn và giá trị mà họ chọn sẽ được điền vào lời nhắc mà Imagen nhận được.Ví dụ:

Đọc thêm

Kỹ thuật viết câu lệnh nâng cao

Hãy sử dụng các ví dụ sau để tạo câu lệnh cụ thể hơn dựa trên các thuộc tính như nội dung mô tả nhiếp ảnh, hình dạng và chất liệu, phong trào nghệ thuật trong quá khứ và đối tượng sửa đổi chất lượng hình ảnh.

Đọc thêm

Nhiếp ảnh

Để sử dụng kiểu này, hãy bắt đầu bằng cách sử dụng các từ khoá cho Imagen biết rõ rằng bạn đang tìm kiếm một bức ảnh. Bắt đầu câu lệnh bằng "Một bức ảnh về. . .". Ví dụ:Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Đọc thêm

Đối tượng sửa đổi ảnh chụp

Trong các ví dụ sau, bạn có thể thấy một số đối tượng sửa đổi và tham số dành riêng cho nhiếp ảnh. Bạn có thể kết hợp nhiều đối tượng sửa đổi để kiểm soát chính xác hơn.Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Đọc thêm

Hình minh hoạ và nghệ thuật

Phong cách nghệ thuật rất đa dạng, từ phong cách đơn sắc như bản phác thảo bằng bút chì đến nghệ thuật số siêu thực tế. Ví dụ: các hình ảnh sau đây sử dụng cùng một câu lệnh với nhiều kiểu khác nhau:"Một [art style or creation technique] của một chiếc sedan điện thể thao góc cạnh với các tòa nhà chọc trời ở hậu cảnh"Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 2.

Đọc thêm

Hình dạng và chất liệu

Một trong những điểm mạnh của công nghệ này là bạn có thể tạo hình ảnh mà nếu không thì rất khó hoặc không thể tạo được. Ví dụ: bạn có thể tạo lại biểu trưng công ty của mình bằng nhiều chất liệu và hoạ tiết.Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Đọc thêm

Tài liệu tham khảo về nghệ thuật lịch sử

Một số kiểu đã trở thành biểu tượng qua nhiều năm. Sau đây là một số ý tưởng về phong cách hội họa hoặc nghệ thuật lịch sử mà bạn có thể thử."tạo hình ảnh theo kiểu [art period or movement] : trang trại gió"Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Đọc thêm

Đối tượng sửa đổi chất lượng hình ảnh

Một số từ khoá nhất định có thể cho mô hình biết rằng bạn đang tìm kiếm một thành phần chất lượng cao. Sau đây là một số ví dụ về đối tượng sửa đổi chất lượng:Sau đây là một số ví dụ về lời nhắc không có đối tượng sửa đổi chất lượng và cùng một lời nhắc có đối tượng sửa đổi chất lượng.Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Đọc thêm

Tỷ lệ khung hình

Tính năng tạo hình ảnh bằng Imagen 3 cho phép bạn đặt 5 tỷ lệ khung hình hình ảnh riêng biệt.

Đọc thêm

Hình ảnh chân thực

Các phiên bản khác nhau của mô hình tạo hình ảnh có thể cung cấp kết quả kết hợp giữa nghệ thuật và ảnh chân thực. Sử dụng các từ sau trong câu lệnh để tạo ra kết quả chân thực hơn, dựa trên chủ thể mà bạn muốn tạo.

Đọc thêm

Chân dung

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra các bức chân dung sau:Câu lệnh: Một người phụ nữ, ảnh chân dung 35mm, hai tông màu xanh dương và xám Mẫu: imagen-3.0-generate-002Câu lệnh: Một người phụ nữ, chân dung 35mm, phim đen Mẫu: imagen-3.0-generate-002

Đọc thêm

Đối tượng

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo các hình ảnh đối tượng sau:Lời nhắc: lá cây cầu nguyện, ống kính macro, 60mm Mẫu: imagen-3.0-generate-002Lời nhắc: một đĩa mì ống, ống kính Macro 100mm Mẫu: imagen-3.0-generate-002

Đọc thêm

Có chuyển động

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo các ảnh động sau:Lời nhắc: một cú chạm bóng thắng lợi, tốc độ chụp nhanh, theo dõi chuyển động Mô hình: imagen-3.0-generate-002Câu lệnh: Một con nai đang chạy trong rừng, tốc độ màn trập nhanh, theo dõi chuyển động Mô hình: imagen-3.0-generate-002

Đọc thêm

Ống kính góc rộng

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra các hình ảnh góc rộng sau:Lời nhắc: một dãy núi rộng lớn, góc rộng 10mm theo chiều ngang Mô hình: imagen-3.0-generate-002Câu lệnh: ảnh mặt trăng, ảnh thiên văn, góc rộng 10mm Mẫu: imagen-3.0-generate-002

Đọc thêm

Bước tiếp theo

Đọc thêm

Bạn đã thích câu chuyện này ?

Hãy chia sẻ bằng cách nhấn vào nút bên trên

Truy cập trang web của chúng tôi và xem tất cả các bài viết khác!

sgk