Trí tuệ nhân tạo (AI) đang len vào mọi khía cạnh của cuộc sống. Nó chính là smartphone của chúng ta, nó đang bước vào nhà chúng ta dưới hình thức một trợ lý ảo trong bộ loa thông minh.
Đó chỉ là những hình thức dễ thấy nhất của AI, trong tương lai nó sẽ được sử dụng ngày một nhiều hơn, AI sẽ chạy ngầm trong các máy chủ phía dưới hậu trường, trong các bánh răng để giữ cho các thành phố thông minh của chúng ta luôn hoạt động.
Tuy nhiên, có một lĩnh vực AI trực tiếp đưa cách mạng đến chúng ta rồi: nhiếp ảnh di động và xử lý hình ảnh - nơi bạn có thể thấy AI làm được những việc kỳ ảo nhất. Hãy xem qua vài ví dụ về ảnh hưởng tích cực từ trí tuệ nhân tạo lên lĩnh vực nhiếp ảnh.
ThinQ AI camera
Đây là phiên bản được quảng bá dữ dội nhất trong đám AI nhiếp ảnh di động hiện thời. Nhiều mẫu LG mới gần đây có trợ lý thông minh giúp nhận diện các chế độ phong cảnh và đối tượng phù hợp để tối ưu ảnh chụp của bạn.
Hẳn nhiên, mỗi nhà sản xuất điện thoại khác nhau sẽ có cách tiếp cận và tính năng AI khác nhau cho camera smartphone của mình, và độ lệch tiếp cận của họ cũng khác nhau xa.
Huawei AI
Ít công ty dám mạnh miệng tuyên bố về AI trong điện thoại như Huawei. Đó là tính năng "đinh" bạn nên cân nhắc nếu mua Huawei P20 Pro.
Họ có riêng một chế độ " Chụp AI" trong ứng dụng camera, có thể nhận diện 1500 loại khung cảnh và tình huống khác nhau. Sau đó máy sẽ áp dụng hồ sơ màu và độ tương phản cho phù hợp, làm cho hình ảnh sống động hơn.
Tiêu chí "đẹp tự nhiên" bị bỏ qua. Huawei AI có xu hướng đẩy độ bão hòa màu lên khá cao, làm ảnh đẹp nhưng trông không thật và kết quả là họ nhận không ít những lời chê (bên cạnh khen) trên mạng xã hội.
Samsung Bixby và Scene Optimizer
Scene Optimizer hoạt động dựa trên việc tối ưu cài đặt cho 20 kiểu khung cảnh khác nhau, từ chụp ban đêm đến thức ăn hay ngoài trời. Mọi thứ hoàn toàn tự động giúp người dùng không phải quá bạn tâm về thông số mà đánh mất khoảnh khắc. Chức năng Flaw Detection cũng được đánh giá cao khi lặng thầm hoạt động và phát hiện ra ai đang chớp mắt, ống kính bị bẩn hay góc chụp bị lóa để "nhắc" người dùng
Scene Optimizer trên Note9
Bixby Vision cũng được tích hợp vào một góc camera Note9, cho phép đọc và dịch văn bản tức thời, nhận dạng vật thể và gợi ý nơi mua, giá bán cũng như thông tin liên quan.
Apple Portrait Lighting (chụp chân dung của iPhone)
Đây là tính năng chụp ảnh hỗ trợ AI của Apple và mô phỏng hiệu ứng của các loại ánh sáng studio khác nhau. Một số điện thoại như Huawei P20 Pro ra mắt chức năng này trước, nhưng Apple là người làm tốt nhất cho đến nay.
Tại sao lại là AI? Chế độ chụp chân dung bao gồm việc tạo bản đồ 3D khuôn mặt đối tượng, sau đó áp dụng bộ lọc để thêm hiệu ứng ánh sáng theo các đường nét nổi khối của đối tượng, như thể chúng được chiếu sáng bởi thiết lập từ phòng studio.
Apple gọi nó là "studio trong túi của bạn". Tất nhiên nó sẽ không thay thế một studio xịn, nhưng kết quả lại hiệu quả đáng ngạc nhiên.
Google Lens
Google là bên phát triển và nghiên cứu công nghệ AI nhiều nhất, một số chế độ camera trên điện thoại của họ xử lý "giống hệt" như AI.
Ví dụ như Shot Top của Pixel 3 là chế độ chụp liên tục chụp một loạt ảnh và sau đó máy tự động chọn ảnh đẹp nhất. Photobooth cũng vậy, nhưng chỉ áp dụng cho ảnh rõ mặt của bạn và bạn bè.
Chỉ cần soi lên là đọc hết đánh giá cửa hàng trên Google
Tuy nhiên, Google Lens còn làm nhiều hơn thế. Đó là chế độ camera nhận dạng theo thời gian thực dựa vào bối cảnh thực tế. Bạn bật Google Lens, soi camera điện thoại vào các sản phẩm, tòa nhà, thậm chí cả các hình nền, và Lens sẽ cố tìm dữ liệu trực tuyến và cung cấp thông tin liên quan.
Google Photos
Một ứng dụng thực tế ít ai nhận thấy với Google Photos: khả năng tìm kiếm ảnh đã được Google nâng lên trình độ hoàn toàn mới
Mở Google Photos của bạn và gõ vào thanh tìm kiếm "Chó", "đám cưới" hay "hoàng hôn" sẽ trả về các bức ảnh có liên quan trong thư viện ảnh chụp của bạn.
Trợ lý ảo này cũng đóng vai trò người quản lý, chọn ảnh đổi thành GIF động, đề xuất các ảnh nên xóa, cải thiện bộ lọc màu hoặc ghép ảnh panorama. Tất cả được dựa trên những thuật toán nhận dạng hình ảnh tiên tiến nhất, (chỉ một số thuật toán được coi là AI)
Phục dựng hình ảnh của Nvidia AI
Nếu các ứng dụng AI trên khiến bạn cảm thấy "bình thường" quá thì Nvidia AI thực sự là một ứng dụng gây choáng ngợp của tương lai. Đây là một trong những cuộc phô diễn công nghệ ấn tượng nhất những năm qua của AI, theo ba cách mà công nghệ này tích hợp:
Đầu tiên là "khử lỗi" cho hình ảnh. AI dùng phương pháp học sâu (deep learning) để khôi phục phần dữ liệu ảnh bị che khuất bởi nhiễu hoặc thậm chí văn bản. Đây thực sự là phiên bản tiên tiến nhất của những gì camera điện thoại có thể làm được khi cố loại bỏ nhiễu hình ảnh ra khỏi một bức ảnh
Tất nhiên AI nhận ra từ một mạng lưới thần kinh được đào tạo bằng cách tiếp xúc với số lượng lớn các hình ảnh khác, giúp nó nhận biết các mẫu và nội suy dữ liệu bị thiếu từ ảnh gốc.
Nvidia AI tự vẽ lại ảnh gốc
Ví dụ hai, một minh chứng mạnh mẽ hơn về sức mạnh của mạng thần kinh của Nvidia là AI vẽ tranh. Trong thử nghiệm, một phần ảnh gốc bị xóa và vẽ lại, thông tin thiếu được AI nội suy qua số lượng hình ảnh khác.
Ví dụ cuối, Nvidia có thể chuyển video 30fps thành cảnh quay 480fps, chậm hơn 16 lần so với video tiêu chuẩn. Dùng cùng một kỹ thuật trong tranh vẽ thông minh, trí tuệ nhân tạo được dùng để tạo ra những dữ liệu vốn không có trong video gốc.
Các loại TV thông minh đời cao hiện nay có chế độ tương tự. Tuy nhiên Nvidia AI xử lý các hình ảnh phức tạp, như cảnh một dải lụa bay phấp phới, trông mượt hơn nhiều.
Iconem
AI hiện là những miếng gạch nhỏ, không xuất sắc nhưng khi áp dụng trên quy mô lớn thì tạo ra kết quả đáng kinh ngạc.
Đó là mô tả về Iconem, một startup về di tích sử dụng AI do Microsoft phát triển
Mục tiêu của Iconem là ghi lại hình ảnh của các di tích lịch sử quan trọng dưới sự đe dọa từ chiến tranh, xói mòn hoặc các loại thiệt hại khác, tạo ra một phiên bản 3D thời gian thực (giống như các tòa nhà 3D trên Google Maps)
Công việc của AI là lập bản đồ hàng chục nghìn bức ảnh tạo thành mô hình 3D được quét của một trang di tích, đồng thời sử dụng máy bay không người lái chụp các hình ảnh được yêu cầu. Iconem cũng dùng để lấy ảnh những nơi nguy hiểm, chẳng hạn như nhà thờ Hồi giáo Great Umayyad ở Aleppo trong chiến tranh Syria.
Google BigGAN
DeepMind là công ty AI con của Alphabet, và BigGAN là một trong những dự án mới nhất - được phát minh bởi duy nhất một thực tập sinh. Đây là phần mềm AI tạo ra hình ảnh bằng cách sử dụng thuật toán.
Đầu tiên, hình ảnh được tạo ra theo thuật toán từ một số ngẫu nhiên, hình ảnh sau đó được so sánh với ảnh "thực" để phân tích mức độ gần đúng. Một phiên bản mới của hình ảnh được tạo ra và cứ như thế hình ảnh ngày càng hoàn thiện hơn.
Nói dễ hiểu, bạn gõ "chó" hoặc "cây" thì BigGAN sẽ hoàn toàn tự vẽ ra "chó" hoặc "cây" bằng thuật toán (nhờ việc học hàng vạn tấm hình khác)
Đây là những hình ảnh được BigGAN tạo ra 100% từ thuật toán
Những ứng dụng tương lai của GAN là vô cùng lớn khi có thể tạo ra những hình ảnh cầu thủ đá FIFA trông "như thật", mô hình hóa các đối tượng 3D từ ảnh. Tháng 5/2018, người ta đã tạo ra một video giả Donald Trump mà không cần dùng đến chút kiến thức đồ họa nào, chỉ hoàn toàn nhờ lập trình (đây là mặt xấu của nó – có thể bị dùng để tạo ra tin tức video giả). Trong lĩnh vực y học,GAN đang được hi vọng giúp con người hiểu cơ chế di căn của tế bào ung thư khi có một lượng dữ liệu ảnh chụp đủ lớn.