Công nghệ dịch

Bí thuật phá vỡ rào cản ngôn ngữ của các công cụ phiên dịch theo thời gian thực

Các câu văn chuyển ngữ thật khó hiểu?

rong thế giới khoa học viễn tưởng của cuốn tiểu thuyết Đường tới dải Ngân hà, bạn chỉ cần chạm nhẹ vào chú cá Babel màu vàng sáng trên tai và ngay lập tức có thể hiểu bất kỳ ngôn ngữ nào.

Mặc dù chúng ta chưa hoàn toàn đạt được trình độ đó, các vấn đề liên quan tới ngôn ngữ đang gặp ít rào cản hơn rất nhiều so với các thế hệ trước.

Dave Limp, phó chủ tịch cấp cao về thiết bị và dịch vụ của Amazon đã nói rằng “Việc hiểu các ngôn ngữ khác nhau sẽ trở thành một điều bình thường mới”. Ông cũng cho biết, thế hệ trẻ sẽ không bao phải lớn lên trong một thế giới mà con người không thể hiểu được tiếng nói của nhau chỉ vì có sự khác biệt về ngôn ngữ. Điều đó chắc chắn sẽ xảy ra.”

Dần đạt được mục tiêu này, công nghệ ngày nay đang giúp diễn giải thế giới xung quanh theo những cách gần như liền mạch và ngay lập tức. Từ các ứng dụng trên điện thoại cho đến các trợ lý cá nhân ảo đa ngôn ngữ, việc giao tiếp với đối tác, gia đình, bạn bè không cùng chung một ngôn ngữ khi đi du lịch hay mua sắm đang ngày càng dễ dàng hơn.

Tuy nhiên, bất chấp tất cả các lợi ích dễ nhận thấy trong nhiều năm qua, đừng kỳ vọng rằng điện thoại, loa thông minh, PC hoặc thiết bị tai nghe sẽ sớm phá vỡ toàn bộ các rào cản về ngôn ngữ – hay viện cớ để bùng lớp tiếng Pháp.

Sự cần thiết của dịch thuật

Trong thế giới luôn kết nối này, nhu cầu hiểu nhau là điều quan trọng hơn bao giờ hết.

Giám đốc sản phẩm Google AI – Barak Turovsky cho rằng “Một nửa nội dung trên internet là bằng tiếng Anh, nhưng chỉ 20% dân số toàn cầu có thể sử dụng tiếng Anh nào”.

Và trong khi công nghệ dịch thuật văn bản của Microsoft hỗ trợ tới 70 ngôn ngữ và chức năng dịch giọng nói của ứng dụng này có thể giải mã khoảng 40 loại, thì một kỹ sư của Microsoft và giám đốc công nghệ của AI Services, Xuedong Huang vẫn bày tỏ hạn chế rằng đó chỉ là một phần trong số 7.000 ngôn ngữ được sử dụng trên hành tinh hiện nay.

Đồng thời, hơn một nửa trong số 2,5 tỷ người trên Facebook đăng bài bằng ngôn ngữ khác tiếng Anh. Facebook sử dụng trí thông minh nhân tạo trên chính mạng xã hội này, cũng như trên Messenger và Instagram, dẫn đến hơn 6 tỷ bản dịch mỗi ngày.

Tuy nhiên, đối với lĩnh vực như chính trị, pháp lý, tài chính và sức khỏe, các phương pháp dịch máy bằng Ai vẫn không thể thay thế cho các phiên dịch viên và dịch giả giỏi, chi phí cao, mặc dù đôi khi họ cũng cần dựa vào máy móc.

Và sự phụ thuộc này đang trở thành những miếng lời ngon trên thương trường. Florian Faes, giám đốc điều hành của Slator, một nhà cung cấp tin tức và phân tích có trụ sở tại Thụy Sĩ về ngành ngôn ngữ toàn cầu, ước tính mảng dịch thuật từ B2B là thị trường có trị giá 23 tỷ USD mỗi năm.

“Khi một công ty dược phẩm lớn cần chạy thử nghiệm lâm sàng, họ sẽ cần tài liệu hỗ trợ bằng 10 ngôn ngữ; hoặc khi một ngân hàng muốn công bố nghiên cứu vốn chủ sở hữu cho các nhà đầu tư tổ chức Nhật Bản, họ sẽ thuê các công ty dịch thuật B2B để dịch văn bản đó”, ông nói.

Đối mực đích sử dụng thông thường hoặc không thường xuyên, phương pháp dịch thuật theo thời gian thực đang ngày càng được nâng cấp hơn, ngay cả khi kết quả vẫn chưa thể hoàn hảo. Nhưng liệu bạn có tin dùng nó để phiên dịch cho một đại biểu Liên Hợp Quốc không? Có lẽ là chưa.

“Bạn có thường xuyên khiển trách Alexa hoặc Google hoặc Siri vì không hiểu bạn không?, Hans Hansen, Giám đốc điều hành của Hoa Kỳ cho ứng dụng học ngôn ngữ Babbel hỏi. “Nhưng càng nói chuyện với chúng, công nghệ này sẽ càng tiến bộ.”

Hey Google, Hey Alexa …

Điện thoại thông minh của bạn đã có thể lưu trữ toàn bộ dữ liệu tương đương với cuốn danh bạ bạn đi nghỉ ngày xưa. Ngày nay, khi đi du lịch, bạn có thể sử dụng Google Dịch hoặc Microsoft Translator, và tận dụng các tính năng cho phép giải mã các biển báo và menu bằng cách chụp ảnh văn bản.

Ở nhà, bạn có thể hỏi chiếc loa thông minh Amazon Echo hoặc Google Home của bạn cách nói hoặc phát âm một thứ gì đó bằng ngôn ngữ khác; Alexa và Google Assistant sẽ nhanh chóng đưa ra phản hồi. Và nếu thiết bị của bạn có màn hình, bạn cũng có thể đọc các từ và ký tự này.

Prem Natarajan, VP của Alexa AI nói rằng: “Người dùng đang tìm kiếm rất nhiều ứng dụng sáng tạo nhằm mục đích cơ bản như đối đáp trò chuyện theo thời gian thực”, ông cũng nhấn mạnh về một trường hợp tiềm năng như sau: Một người phối ngẫu là một người nói tiếng Trung Quốc và người kia chủ yếu nói tiếng Anh. “Không có ai thông trong số 2 người thành thạo ngôn ngữ của người người còn lại.”

Chế độ Google Dịch có thể thực hiện chuyển ngữ theo thời gian thực với 44 ngôn ngữ trên điện thoại của bạn. Bạn có thể bắt đầu bằng cách gọi “Hey Google, hãy giúp tôi nói tiếng Thái”. Trong một số trường hợp, Trợ lý sẽ đề xuất các câu Trả lời thông minh, để cho phép bạn nhanh chóng phản hồi mà không cần nói.

Ứng dụng Google Dịch có hơn 1 tỷ người dùng hoạt động hàng tháng, 95% từ bên ngoài Hoa Kỳ; hơn 140 tỷ từ được dịch hàng ngày.

Công ty có kế hoạch ra mắt tính năng Bản dịch trực tiếp trong vài tháng tới, hứa hẹn sẽ biến điện thoại Android của bạn thành một thiết bị dịch thuật thời gian thực ngay cả với bài phát biểu dài.

Về phần mình, các khả năng dịch của Microsoft lần lượt xuất hiện trên phổ sản phẩm: PowerPoint, Edge, Outlook, Word, Skype và trên PC, thiết bị iOS và Android, thậm chí cả máy đọc sách điện tử Kindle.

Hai năm trước, các nhà nghiên cứu của Microsoft cho biết họ đã tạo ra hệ thống dịch máy đầu tiên có thể dịch các câu của các bài báo từ tiếng Trung sang tiếng Anh với chất lượng và độ chính xác như người.

Ngã rẽ lầm lạc của dịch thuật

Có rất nhiều lời buộc tội rằng, dịch thuật nhân tạo rất giả và chúng bao gồm có thể gây ra các tình huống hết sức mất mặt cho đến nguy hiểm.

Do lỗi kỹ thuật, nhà lãnh đạo Trung Quốc Tập Cận Bình gần đây đã bị dịch thành một từ chửi rủa khi các bài đăng trên Facebook được dịch từ tiếng Miến Điện sang tiếng Anh. Tên chủ tịch Trung Quốc rõ ràng đã bị thiếu trong cơ sở dữ liệu ngôn ngữ Miến Điện của Facebook, vì vậy hệ thống đã cố gắng thay thế những từ đó bằng các âm tiết tương tự. Và nó đã gây ra một sai lầm khủng khiếp

“Chúng tôi đã thực hiện các bước để đảm bảo điều này không xảy ra lần nữa. Chúng tôi chân thành xin lỗi vì sự cố lần này”, một phát ngôn viên của Facebook cho biết.

Năm ngoái, các nhà nghiên cứu tại Đại học California-San Francisco đã phát hiện ra rằng thuật toán học máy mà Google tung ra năm 2017 có độ chính xác 92% trong việc dịch các đơn thuốc của bác sĩ từ tiếng Anh sang tiếng Tây Ban Nha và chính xác 81% từ tiếng Anh sang tiếng Trung Quốc. Chỉ có 2% lỗi trong tiếng Tây Ban Nha và 8% trong tiếng Trung được coi là có khả năng gây ra tác hại đáng kể về mặt lâm sàng.

“Thật tuyệt vời nếu tôi ở trong nhóm 92%, và cũng thật kinh khủng nếu ở nhóm 8% bệnh nhân đang được truyền đạt hoàn toàn trái ngược với những gì bác sĩ muốn nói với tôi”, Jost Zetzsche, một người phát ngôn tại Hiệp hội dịch thuật Hoa Kỳ và đồng tác giả của cuốn “Khám phá dịch thuật: Ngôn ngữ định hình cuộc sống của chúng ta và biến đổi thế giới như thế nào” bày tỏ.

Dịch thuật hoạt động tốt nhất trong các môi trường được kiểm soát, hoặc ở đó có rất nhiều dữ liệu đào tạo các mô hình. Ví dụ, có rất nhiều dữ liệu giữa tiếng Anh và tiếng Tây Ban Nha, so với tiếng Phần Lan đến tiếng Miến Điện. Trong việc đào tạo các hệ thống, một ngôn ngữ trung gian như tiếng Anh có thể được sử dụng, thay vì ghép nối trực tiếp từ ngôn ngữ ít phổ biến này sang ngôn ngữ khác.

Qua nhiều năm, máy móc đã thu thập dữ liệu từ các bản dịch của Kinh thánh, dữ liệu của Liên hợp quốc, các tờ báo đa quốc gia và các nguồn công khai khác, theo ông Turovsky.

Một bước đột phá lớn đã đến vào năm 2016 cùng với việc đưa vào sử dụng công nghệ “mạng lưới nơ-ron” sâu cho phép máy móc hiểu được bối cảnh của toàn bộ câu, cải thiện sự lưu loát của bản dịch. Các hệ thống trước đó bị hạn chế vì chúng phải chia các câu thành nhiều phần, ngắt kết nối ý nghĩa khỏi các từ thực tế.

Có rất nhiều yếu tố có thể gây ra rắc rối, đặc biệt là khi một người đang nói. Hãy thử suy nghĩ mà xem: các giọng khác nhau, tốc độ giọng nói và sự gián đoạn âm thanh như “um” và “uh”. Ngoài ra, châm biếm, thành ngữ và thông tục văn hóa rất có thể sẽ không cần phải dịch trong mọi trường hợp.

“Dịch thuật thường đôi khi chỉ có thể giải thích theo nghĩa đen của những từ thông tục và đôi khi bản dịch đó lại trái ngược với ý nghĩa và bối cảnh”, theo ông Thomas Thomas, tổng giám đốc của IBM Data và Watson AI.

Tương lai của công nghệ ngôn ngữ

Tuy nhiên, những phát minh dịch máy như chú cá Babel trong khoa học viễn tưởng vẫn chưa thể xuất hiện ở thế giới thực sớm như chúng ta nghĩ.

Tháng Tư này, Waverly Labs có kế hoạch xuất xưởng một thiết bị phiên dịch $199 có tên là Ambassador – Đại sứ, hỗ trợ 20 ngôn ngữ và 42 phương ngữ.

Nó được lấy cảm hứng từ một sản phẩm dịch ngôn ngữ Waverly trước đó có tên Pilot Smart Ear và Pixel Pixel Buds, hoạt động cùng với ứng dụng Google Dịch mới nhất trên điện thoại Android với Google Assistant.

Ambassador sử dụng một bộ micro để thu lời nói và chủ động lắng nghe ngôn ngữ được chọn trong phạm vi khoảng 8 feet. Trong chế độ nghe này, bạn có thể trực tiếp nghe bản dịch và cũng có thể đọc được các từ trong ứng dụng đồng hành.

Trong chế độ trò chuyện, có tới bốn người sử dụng Ambassador có thể tham gia vào một cuộc trò chuyện trôi chảy, theo lời tuyên bố của công ty này.

Và với chế độ giảng bài, Ambassador sẽ phát lời của một người nói đeo thiết bị, cho nhiều người trong hội trường bằng cách truyền các bản dịch âm thanh đến điện thoại thông minh giảng viên, sau đó có thể phát qua loa.

Liệu những tiến bộ này có thể đánh dấu sự cho sự kết thúc của các dịch giả của con người? “Có thể”, Zetzsche của Hiệp hội dịch giả Mỹ bàn luận với các dịch giả đồng nghiệp – “nhưng tương lai này vẫn sẽ còn rất xa”.

“Nhưng tại thời điểm đó, mọi người đều đã được thay thế”, ông nói, “kể cả bác sĩ và luật sư”.


Về Conviwork

Conviwork là Phần mềm dịch thuật được tích hợp trí tuệ nhân tạo, giúp giảm giúp giảm 80% thời gian dịch, hỗ trợ đọc file văn bản Word, Excel, Powerpoint và PDF.

Đăng ký dùng thử tại: https://conviwork.com/
Hotline: 024 668 23 198
Địa chỉ: Tòa U-Base, số 28, ngõ 76/2, Duy Tân, Cầu Giấy, Hà Nội
Email liên hệ: sales@conviwork.com

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *