Tạo hình ảnh
Trước khi bắt đầu
Trước khi gọi Gemini API, hãy đảm bảo bạn đã cài đặt SDK mà bạn chọn và khoá Gemini API đã được định cấu hình và sẵn sàng sử dụng.
Tạo hình ảnh bằng Gemini
Gemini 2.0 Flash Experimental hỗ trợ khả năng xuất văn bản và hình ảnh cùng dòng. Điều này cho phép bạn sử dụng Gemini để chỉnh sửa hình ảnh theo cách trò chuyện hoặc tạo đầu ra có văn bản đan xen (ví dụ: tạo một bài đăng trên blog có văn bản và hình ảnh trong một lượt). Tất cả hình ảnh được tạo đều có hình mờ SynthID và hình ảnh trong Google AI Studio cũng có hình mờ hiển thị.Ví dụ sau đây cho thấy cách sử dụng Gemini 2.0 để tạo đầu ra văn bản và hình ảnh:Tuỳ thuộc vào câu lệnh và ngữ cảnh, Gemini sẽ tạo nội dung ở nhiều chế độ (văn bản sang hình ảnh, văn bản sang hình ảnh và văn bản, v.v.). Dưới đây là một số ví dụ:
Chỉnh sửa hình ảnh bằng Gemini
Để chỉnh sửa hình ảnh, hãy thêm hình ảnh làm dữ liệu đầu vào. Ví dụ sau đây minh hoạ cách tải hình ảnh được mã hoá base64 lên. Đối với nhiều hình ảnh và tải trọng lớn hơn, hãy kiểm tra phần đầu vào hình ảnh.
Các điểm hạn chế
Chọn một mô hình
Bạn nên sử dụng mô hình nào để tạo hình ảnh? Điều này phụ thuộc vào trường hợp sử dụng của bạn.Gemini 2.0 phù hợp nhất để tạo hình ảnh phù hợp theo ngữ cảnh, kết hợp văn bản và hình ảnh, kết hợp kiến thức về thế giới và suy luận về hình ảnh. Bạn có th...
Tạo hình ảnh bằng Imagen 3
API Gemini cung cấp quyền truy cập vào Imagen 3, mô hình chuyển văn bản thành hình ảnh có chất lượng cao nhất của Google, với một số tính năng mới và cải tiến. Imagen 3 có thể làm những việc sau:Hiện tại, Imagen chỉ hỗ trợ câu lệnh bằng tiếng Anh và các thông số sau:
Tham số mô hình Imagen
(Quy ước đặt tên khác nhau tuỳ theo ngôn ngữ lập trình.)
Hướng dẫn về câu lệnh Imagen
Phần này của hướng dẫn về Imagen cho bạn biết cách sửa đổi câu lệnh chuyển văn bản sang hình ảnh có thể tạo ra nhiều kết quả khác nhau, cùng với ví dụ về hình ảnh bạn có thể tạo.
Kiến thức cơ bản về cách viết câu lệnh
Câu lệnh hay phải mang tính mô tả và rõ ràng, đồng thời sử dụng các từ khoá và đối tượng sửa đổi có ý nghĩa. Hãy bắt đầu bằng cách suy nghĩ về chủ đề, ngữ cảnh và phong cách.Sau khi viết phiên bản đầu tiên của câu lệnh, hãy tinh chỉnh câu lệnh bằng cách...
Tạo văn bản trong hình ảnh
Imagen có thể thêm văn bản vào hình ảnh, mở ra nhiều khả năng tạo hình ảnh sáng tạo hơn. Hãy làm theo hướng dẫn sau để khai thác tối đa tính năng này:
Tham số hoá lời nhắc
Để kiểm soát tốt hơn kết quả đầu ra, bạn nên tham số hoá dữ liệu đầu vào vào Imagen. Ví dụ: giả sử bạn muốn khách hàng có thể tạo biểu trưng cho doanh nghiệp của họ và bạn muốn đảm bảo biểu trưng luôn được tạo trên nền màu đồng nhất. Bạn cũng muốn giới hạn các tuỳ chọn mà ứng dụng có thể chọn trong trình đơn.Trong ví dụ này, bạn có thể tạo một lời nhắc có tham số tương tự như sau:Trong giao diện người dùng tuỳ chỉnh, khách hàng có thể nhập các tham số bằng trình đơn và giá trị mà họ chọn sẽ được điền vào lời nhắc mà Imagen nhận được.Ví dụ:
Kỹ thuật viết câu lệnh nâng cao
Hãy sử dụng các ví dụ sau để tạo câu lệnh cụ thể hơn dựa trên các thuộc tính như nội dung mô tả nhiếp ảnh, hình dạng và chất liệu, phong trào nghệ thuật trong quá khứ và đối tượng sửa đổi chất lượng hình ảnh.
Nhiếp ảnh
Để sử dụng kiểu này, hãy bắt đầu bằng cách sử dụng các từ khoá cho Imagen biết rõ rằng bạn đang tìm kiếm một bức ảnh. Bắt đầu câu lệnh bằng "Một bức ảnh về. . .". Ví dụ:Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.
Đối tượng sửa đổi ảnh chụp
Trong các ví dụ sau, bạn có thể thấy một số đối tượng sửa đổi và tham số dành riêng cho nhiếp ảnh. Bạn có thể kết hợp nhiều đối tượng sửa đổi để kiểm soát chính xác hơn.Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.
Hình minh hoạ và nghệ thuật
Phong cách nghệ thuật rất đa dạng, từ phong cách đơn sắc như bản phác thảo bằng bút chì đến nghệ thuật số siêu thực tế. Ví dụ: các hình ảnh sau đây sử dụng cùng một câu lệnh với nhiều kiểu khác nhau:"Một [art style or creation technique] của một chiếc sedan điện thể thao góc cạnh với các tòa nhà chọc trời ở hậu cảnh"Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 2.
Hình dạng và chất liệu
Một trong những điểm mạnh của công nghệ này là bạn có thể tạo hình ảnh mà nếu không thì rất khó hoặc không thể tạo được. Ví dụ: bạn có thể tạo lại biểu trưng công ty của mình bằng nhiều chất liệu và hoạ tiết.Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.
Tài liệu tham khảo về nghệ thuật lịch sử
Một số kiểu đã trở thành biểu tượng qua nhiều năm. Sau đây là một số ý tưởng về phong cách hội họa hoặc nghệ thuật lịch sử mà bạn có thể thử."tạo hình ảnh theo kiểu [art period or movement] : trang trại gió"Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.
Đối tượng sửa đổi chất lượng hình ảnh
Một số từ khoá nhất định có thể cho mô hình biết rằng bạn đang tìm kiếm một thành phần chất lượng cao. Sau đây là một số ví dụ về đối tượng sửa đổi chất lượng:Sau đây là một số ví dụ về lời nhắc không có đối tượng sửa đổi chất lượng và cùng một lời nhắc có đối tượng sửa đổi chất lượng.Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng cách sử dụng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.
Tỷ lệ khung hình
Tính năng tạo hình ảnh bằng Imagen 3 cho phép bạn đặt 5 tỷ lệ khung hình hình ảnh riêng biệt.
Hình ảnh chân thực
Các phiên bản khác nhau của mô hình tạo hình ảnh có thể cung cấp kết quả kết hợp giữa nghệ thuật và ảnh chân thực. Sử dụng các từ sau trong câu lệnh để tạo ra kết quả chân thực hơn, dựa trên chủ thể mà bạn muốn tạo.
Chân dung
Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra các bức chân dung sau:Câu lệnh: Một người phụ nữ, ảnh chân dung 35mm, hai tông màu xanh dương và xám Mẫu: imagen-3.0-generate-002Câu lệnh: Một người phụ nữ, chân dung 35mm, phim đen Mẫu: imagen-3.0-generate-002
Đối tượng
Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo các hình ảnh đối tượng sau:Lời nhắc: lá cây cầu nguyện, ống kính macro, 60mm Mẫu: imagen-3.0-generate-002Lời nhắc: một đĩa mì ống, ống kính Macro 100mm Mẫu: imagen-3.0-generate-002
Có chuyển động
Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo các ảnh động sau:Lời nhắc: một cú chạm bóng thắng lợi, tốc độ chụp nhanh, theo dõi chuyển động Mô hình: imagen-3.0-generate-002Câu lệnh: Một con nai đang chạy trong rừng, tốc độ màn trập nhanh, theo dõi chuyển động Mô hình: imagen-3.0-generate-002
Ống kính góc rộng
Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra các hình ảnh góc rộng sau:Lời nhắc: một dãy núi rộng lớn, góc rộng 10mm theo chiều ngang Mô hình: imagen-3.0-generate-002Câu lệnh: ảnh mặt trăng, ảnh thiên văn, góc rộng 10mm Mẫu: imagen-3.0-generate-002
Bước tiếp theo
Bạn đã thích câu chuyện này ?
Hãy chia sẻ bằng cách nhấn vào nút bên trên
Truy cập trang web của chúng tôi và xem tất cả các bài viết khác!