Chiêu bài kiểm duyệt mới của Facebook: AI "Rosetta"

14 Thg 09

Sản phẩm con đẻ của tỉ phú Zuckerberg đang được hàng tỷ người ở mọi lứa tuổi sử dụng toàn cầu. Facebook phổ biến đến nỗi nếu ai đó không sử dụng mạng xã hội này, họ sẽ bị người xung quanh nhìn với ánh mặt ngạc nhiên và xa lạ. Do đó, lượng thông tin trên Facebook là vô cùng, với bất kì tài khoản nào có thể đăng tải bất kì thông tin nào, thì Facebook sẽ hỗn loạn và cực kì nhiều lượng thông tin rác. Đó là lý do Facebook tung chiêu bài kiểm duyệt mới: AI "Rosetta" có thể trích xuất văn bản từ 1 tỷ hình ảnh mỗi ngày.

Related image

Người dùng đang bị bủa vây bởi lượng thông tin cực lớn (Ảnh: VOX)

Chiêu bài kiểm duyệt mới của Facebook: AI "Rosetta"

Mọi người khi online không chỉ giao tiếp với nhau thông qua ngôn từ mà còn qua hình ảnh. Đối với một nền tảng như Facebook với hơn 2 tỷ người hoạt động mỗi tháng, điều đó có nghĩa là có vô số các hình ảnh được đăng tải mỗi ngày, bao gồm cả các meme với mục đích "Troll". Nhằm đưa các hình ảnh đi kèm với văn bản vào các kết quả tìm kiếm hình ảnh tương ứng, để các chương trình đọc màn hình có thể hiểu được nội dung được viết trên các hình ảnh và đảm bảo chúng không chứa các nội dung xấu, các từ ngữ vi phạm chính sách nội dung của website, Facebook đã tạo và triển khai một hệ thống machine learning quy mô rộng gọi là "Rosetta".

Facebook cần một hệ thống nhận diện ký tự quang học có thể thường xuyên xử lý một lượng lớn nội dung, do đó họ phải "cầu cứu" đến công nghệ của riêng mình. Theo mạng xã hội này, Rosetta có thể trích xuất văn bản từ hơn 1 tỷ hình ảnh và khung hình video có bao gồm rất nhiều loại ngôn ngữ khác nhau mỗi ngày trong thời gian thực!

Image result for facebook news censor

Facebook đã tạo và triển khai một hệ thống machine learning quy mô rộng gọi là "Rosetta" (Ảnh: Turtle Boy Sport)

>>> Xem thêm: Chatbot – Công cụ gia tăng trải nghiệm khách hàng về sản phẩm và thương hiệu >>> Xem thêm: Cách tạo Fanpage trên Facebook đơn giản cho các doanh nghiệp

Trong một bài đăng blog mới, công ty đã giải thích cách thức hoạt động của Rosetta như sau: nó bắt đầu bằng cách phát hiện các vùng hình chữ nhật trong các hình ảnh có khả năng chứa văn bản. Sau đó, nó sử dụng một mạng thần kinh xoắn ốc để nhận diện và biên dịch nội dung được viết trong vùng đó, kể cả các từ không phải Tiếng Anh hay các ký tự không phải Tiếng Latin, như Ả-rập và Hindi. Để huấn luyện hệ thống này, Facebook đã sử dụng một tập hợp các hình ảnh công khai được ghi chú bởi cả con người lẫn máy tính.

Các nhóm khác nhau trong nội bộ Facebook và Instagram đã và đang sử dụng Rosetta để kiểm duyệt các nội dung và giữ cho các nền tảng mạng xã hội của họ luôn trong tình trạng "sạch sẽ". Công ty có dự định tiếp tục "dạy" cho AI của mình biết thêm nhiều ngôn ngữ nữa, đồng thời cải thiện kỹ năng trích xuất văn bản từ các khung hình video của nó.

AI Rosetta thực hiện quá trình kiểm duyệt qua hai bước: phát hiện những hình ảnh có khả năng chứa văn bản và sau đó nhận ra văn bản trong hình ảnh thực sự là gì. Mô hình này không chỉ dành cho ngôn ngữ tiếng Anh, vì Facebook nói rằng nó hỗ trợ các ngôn ngữ và mã hóa khác nhau bao gồm tiếng Ả Rập và tiếng Hin-ddi. Hay ho hơn, hệ thống cũng có khả năng đọc từ phải sang trái.

Hiện Facebook đã thêm vào dịch vụ biên dịch tự động của mình 24 ngôn ngữ mới, bao gồm tiếng Serbia, Belarus, Marathi, Sinhal, Telugu, Nepal, Kannada, Urdu, Punjabi, Cambodia, Pashto, Mongolia, Zulu, Xhosa và Somali. Facebook thừa nhận rằng khả năng biên dịch các ngôn ngữ mới thêm vào này vẫn còn ở giai đoạn sơ khai, do đó sẽ có khá nhiều lỗi biên dịch. Hãng dự định tiếp tục cải tiến chúng và giới thiệu thêm nhiều ngôn ngữ nữa trong tương lai.

Bước đi đúng đắn của Facebook

Trong quá khứ, Facebook đã phải vật lộn để xác định đầy đủ những lời nói có tính thù địch hoặc thông tin gây tranh cãi. Bắt đầu từ Bắc Mỹ và châu Âu, số người dùng xóa tài khoản Facebook tăng mạnh tới mức Zuckerberg phải lo ngại. Theo số liệu mới nhất của eMarketer, với tốc độ từ bỏ Facebook như hiện nay, mạng xã hội sẽ mất khoảng 2 triệu người dùng từ 24 tuổi trở xuống, chỉ riêng tại Mỹ. Theo thời gian, tin tức trở nên loãng hơn, rác hơn, gây nhiều thông tin tranh cãi hơn với các bài quảng cáo loãng khiến Facebook mất đi sự hấp dẫn ban đầu.

Sử dụng trí tuệ nhân tạo để đánh giá mức độ nghiêm trọng của lời nói đã gặp không ít khó khăn. Trên thực tế, Perspective AI của Google, được sử dụng để phát hiện các nhận xét có hại, có thể bị lừa dễ dàng với lỗi chính tả, dấu cách giữa các từ và thêm các từ không liên quan vào câu gốc. Do đó, việc Facebook tung chiêu bài Rosetta AI có thể khiến nền tảng này trở nên đáng tin tưởng hơn trong mắt người dùng. Từ đó thu hút nhiều người dùng hơn, cũng như nhiều nhà đầu tư tài trợ hơn.

Related image

Chiêu bài Rosetta AI có thể khiến Facebook trở nên đáng tin tưởng hơn trong mắt người dùng (Ảnh: Gizmodo)

Kết

Thực ra, với khoảng 350 triệu bức ảnh được tải lên mạng xã hội mỗi ngày, Rosetta và Facebook đang chiến đấu trong một trận chiến cực kì khó khăn. Dù sao, ta vẫn đặt kì vọng lớn vào nền tảng này. Trong tương lai, Facebook cho biết họ đang tìm một giải pháp hướng tới việc kiểm soát văn bản xuất hiện trong video, mặc dù đòi hỏi một hệ thống phức tạp hơn tương thích với loại công nghệ hơn, nhưng ông lớn Facebook khẳng định: không có gì là không thể!

Nguồn: Tổng hợp

Đánh giá của bạn

TAGS:

Bình luận của bạn

Bạn cần đăng nhập để thực hiện chức năng này!

Bình luận không đăng nhập

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.