Với những tiến bộ mới trong việc tạo và xử lý ngôn ngữ tự nhiên, xu hướng phân tích dữ liệu vẫn sẽ tiếp tục nổi lên trong năm 2018. Nhờ sử dụng các hệ thống dựa trên quy tắc như Wordsmith của Automated Insights, các công ty truyền thông có thể tự động chuyển dữ liệu có cấu trúc thành những câu chuyện thông minh dựa trên ngôn ngữ tự nhiên.
Việc đưa dữ liệu trở nên "bình dân" để ngay cả những người ngoại đạo với khoa học dữ liệu vẫn có thể hiểu được sẽ làm cho AI và dữ liệu lớn lan tỏa rộng hơn; giúp dẫn đến thời đại tự động tạo ra những hiểu biết sâu sắc.
Hiện nay, phần mềm AI tự tạo nội dung đã được áp dụng rộng rãi trong nhiều lĩnh, bao gồm nội dung tin tức, truyền thông xã hội, tiếp thị, thể thao, báo cáo tài chính và hơn thế nữa.
Trong năm 2018, năng lực tự tạo ra nội dung tự động có thể sẽ có những bước tiến bộ trong lĩnh vực tường thuật tin tức và marketing, giúp các công ty phản hồi kịp thời các xu hướng, tin tức và sự kiện mới nổi bằng cách tạo ra nội dung có liên quan cho khán giả và khách hàng.
Sự nổi lên của mạng nơ ron nhân tạo CapNets
Mạng Capsule (CapsNet) là một hình thức mới của mạng nơ-ron sâu được đề xuất bởi nhà khoa học hàng đầu của Google Geoffrey Hinton trong một bài báo gần đây. Nói một cách đơn giản, CapsNet có thể khắc phục những thiếu sót của các mạng nơ ron xoắn (Convolutional Neural Network – CNN) trong việc nhận diện hình ảnh.
Về cơ bản, CNN hoạt động tốt khi hình ảnh nhận diện tương tự với hình ảnh mà nó nhận được trong quá trình đào tạo trước đó. Trong trường hợp hình ảnh nhập liệu khác đi, ví dụ như bị xoay, nghiêng thì CNN có hiệu suất kém. CNNs không có khả năng giải thích các mối quan hệ không gian trong bức ảnh. Điều này khiến nó có thể bị đánh bằng cách thay đổi vị trí của các yếu tố đồ hoạ hoặc góc của hình ảnh.
Ngược lại, các mạng nơ-ron CapsNet nắm được mối quan hệ không gian giữa các yếu tố đồ họa và hiểu các mô hình hình học tự nhiên mà con người nắm bắt trực giác. Họ có thể nhận ra các vật thể bất kể từ góc ảnh nào.
Các nhà bình luận dự đoán rằng mạng nơ-ron CapNets sẽ tạo một bước lớn trong mô hình nhận diện hình ảnh.
AI phi tập trung (Decentralized AI)
Cho đến gần đây, việc đào tạo các mô hình máy học được thực hiện theo phong cách tập trung trên các nền tảng đám mây được điều khiển từ xa. Các công ty AI phải thu thập bộ dữ liệu đào tạo theo cách thức thủ công và cung cấp chúng cho các thuật toán máy học chạy trong các trung tâm dữ liệu được trang bị những phần cứng chuyên dụng phục vụ lĩnh vực máy học (machine learning). Khuyết điểm của mô hình tập trung này đó là việc
Gần đây, các hoạt động nghiên cứu và phát triển phần mềm thông qua phương thức phân tích dữ liệu của các công ty AI thường được tiến hành một cách tổng thể. Theo đó, họ sẽ thu thập thông tin về cách mà người dùng sử dụng ứng dụng của họ, chuyển tất cả dữ liệu về máy chủ đặt trên đám mây và phát triển các thuật toán mới dựa trên kết quả phân tích. Quá trình này có rất nhiều lợi ích.
Tuy vậy quá trình cập nhật các ứng dụng cũng như thu hồi thông tin về thói quen của người dùng tốn rất nhiều thời gian; đồng thời khó thực hiện cập nhật các phần mềm AI từ dữ liệu được thu thập một cách liên tục từ người dùng cũng như các ứng dụng phần mềm.
Vì thế, để giải quyết vấn đề này, vào tháng 04-2017, Google hiện đang thử nghiệm một phương pháp cải tiến trí tuệ nhân tạo mới mang tên Federated Learning, tạm dịch phương pháp tiếp cận Học tập liên kết. Federated Learning được sử dụng trong Gboard, bàn phím Android của Google.
Theo đó, thay vì phân tích dữ liệu một cách cục bộ như trước đây, với Federated Learning, quy trình thu thập dữ liệu và phát triển các thuật toán mới được tiến hành ngay trên các thiết bị. Nói cách khác, tất cả các thiết bị sử dụng dịch vụ của Google đều đang giúp công ty này cải tiến hệ thống trí tuệ nhân tạo của họ.
Nhìn rộng ra, có thể thấy phương pháp Học tập liên kết đem lại nhiều lợi ích, đặc biệt trong các lĩnh vực nơi trí tuệ nhân tạo phải được đào tạo và cập nhật liên tục như máy bay không người lái hoặc xe hơi tự lái.
AI nâng tầm dữ liệu ngoại tuyến (offline data)
Dữ liệu thu được từ môi trường trực tuyến hiện là một trong những nguồn cung đầu vào quan trọng cho các thuật toán và trí tuệ nhân tạo hoạt động. Qua đó, cung cấp những hiểu biết sâu sắc về hành vi mua sắm, tương tác của người dùng.
Ngày nay, nhờ sự bùng nổ của công nghệ Internet kết nối vạn vật (Internet of things - IoTs), dữ liệu ngoại tuyến thu được ngày càng nhiều và trở nên có giá trị. Với IoTs, giờ đây người ta có thể thu được dữ liệu gần như từ mọi thứ.
Ví dụ, bạn vào cửa hàng không người phục vụ Amazon Go chẳng hạn, các thiết bị cảm biến sẽ theo dõi chuyển động của bạn. Từ đó rút ra những thông tin quan trọng như tuyến đường bạn đi trong cửa hàng, thời gian bạn dừng lại trước mỗi sản phẩm ... Tất cả những thông tin này đều hữu ích với chủ cửa hàng.
Dĩ nhiên dữ liệu ngoại tuyến có thể thu được từ khắp nơi chứ không riêng gì các cửa hàng hay siêu thị. Bằng cách đó, thế giới thực được số hóa. Và thông qua thế giới số, nhờ thuật toán và AI, con người ta lại có thêm hiểu biết về thế giới thực. Nói cách khác, AI đang nâng tầm giá trị của dữ liệu trực tuyến.
AI sẽ hiện diện nhiều hơn trên các thiết bị di động
Việc chạy phần mềm AI hoặc thuật toán máy học trên các thiết bị di động gần đây được xem như rất khó khăn do những giới hạn về pin và những hạn chế của năng lực điện toán di động. Tuy vậy, năm 2017, chúng ta đã thấy một bước ngoặc đáng chú ý khi Apple ra mắt CoreML, thư viện máy học của Apple được thiết kế cho hệ điều hành iOS 11.
CoreML cung cấp nhiều modul máy học (ví dụ để nhận diện hình ảnh, phát hiện văn bản, đăng ký hình ảnh và theo dõi đối tượng), có thể dễ dàng tích hợp vào các ứng dụng iOS. Tất cả các modul này đều được tối ưu hóa về hiệu suất để có thể hoạt động trên các thiết bị di động hiệu quả.
Kết quả là giờ đây các nhà phát triển iOS có một thư viện máy học mạnh mẽ trong tầm tay của họ. Điều này hứa hẹn sẽ kéo theo nhiều ứng dụng AI xuất hiện trên các thiết bị di động vào năm 2018.
Với các doanh chủ, kiến thức kinh doanh và am hiểu về thị trường rất quan trọng. Thế nhưng hiểu biết về xu hướng công nghệ cũng quan trọng không kém. Nó giúp doanh nghiệp thích nghi trong một thế giới biến đổi nhanh chóng dưới tác động của công nghệ ngày nay.
(Theo Entrepreneur)