Công nghệ dịch Kỹ năng dịch

DỊCH MÁY DÀNH CHO BIÊN DỊCH VIÊN

dich may danh cho bien phien dich

Dịch máy (MT) đang là chủ đề đang rất được thu hút: Một số người cho rằng dịch máy đã có những tiến bộ vượt bậc, dịch thuật con người không còn cần thiết cho nhiều loại văn bản và dịch máy bằng nơ-ron (NMT) là một cuộc cách mạng tiên phong đánh bại dịch thuật thông thường.

Chủ đề về biên tập cũng đang được thảo luận vô cùng sôi nổi, và nhiều người rất hăng hái bảo vệ ý kiến ​​của riêng mình về chủ đề này. Tất nhiên, đây là chủ đề rất nhạy cảm đối với các dịch giả, bởi dù sao thì sinh kế và tương lai của nghề nghiệp của họ đang bị đe dọa.

Bài viết này cung cấp một cái nhìn tổng quan ngắn gọn về dịch máy và biên tập, cũng như một số mẹo và thủ thuật cho các dịch giả muốn chuẩn bị cho các thử thách sắp tới.

Thông tin cơ bản: Lịch sử dịch máy

Cần làm rõ rằng: Mặc dù những phát triển mới nhất trong lĩnh vực dịch máy bằng nơ-ron là khá đáng chú ý, nhưng chúng ta cũng không nên làm quá lên về khả năng của chúng. Nếu xem xét trên cơ sở rộng hơn, sự phát triển của dịch máy luôn diễn ra dưới dạng “cân bằng chấm câu”. Đã có một số giai đoạn, người ta cứ nghĩ rằng dịch máy bằng nơ-ron đã giết chết nghề dịch thuật.

Ví dụ, đây là trường hợp từ năm 1948, khi bản dịch máy lần đầu tiên được giới thiệu. Tuy nhiên, trong báo cáo ALPAC (Ủy ban tư vấn xử lý ngôn ngữ tự động) được xuất bản năm 1966, các chuyên gia của Viện Hàn lâm Khoa học Quốc gia đã đưa ra kết luận rằng dịch máy chậm hơn, kém chính xác hơn và đắt gấp đôi so với dịch thuật của con người. Sự đo lường đầy tỉnh táo này đã làm dấy lên sự phấn khích trong dư luận.

Vấn đề này lại bùng lên một lần nữa khi IBM giới thiệu dịch máy thống kê vào năm 1988. Sau đó, các phương pháp dịch máy thống kê và dựa trên quy tắc từ lâu đã được coi là “sự trợ giúp” hữu ích trong quá trình dịch thuật. Một lần nữa, lời tiên tri về ngày tận thế của nghề dịch thuật cứ thế lặng dần.

Sự việc xôn xao bắt đầu trở lại khi bài báo khoa học đầu tiên về dịch máy nơ-ron được xuất bản vào năm 2014. Một năm sau, OpenNMT được giới thiệu là công cụ NMT đầu tiên, được phát triển bởi Harvard phối hợp với SYSTRAN.

Bài viết này không phải là một bài học lịch sử, bởi ai cũng đã biết chuyện gì đã xảy ra tiếp đó. Từ Google đến Amazon, Microsoft, Facebook và DeepL, tất cả các doanh nghiệp lớn và nhỏ đều sử dụng trí tuệ nhân tạo và dịch máy nơ-ron. Ngành công nghiệp đang thay đổi, và với sự chuẩn bị đúng đắn, các dịch giả có thể hưởng lợi rất nhiều từ những luồng gió mới này.

Mẹo 1: Sử dụng cả dịch máy và công cụ CAT

Trước kia, dịch máy chủ yếu được cung cấp qua các hệ thống thống kê, nên người dịch không thể kết nối một hệ thống chất lượng cao với công cụ CAT của họ. Theo quan điểm của chi phí đầu vào cao và thời gian hoàn thành, việc cấu hình một hệ thống tùy chỉnh là không cần thiết đối với hầu hết các dịch giả.

Ngày nay, dịch máy nơ-ron cho phép bạn kết nối công cụ CAT của mình với các hệ thống tuyệt vời, đáng tin cậy với một mức phí hợp lý. Với các hệ thống này, bạn có thể xử lý các tác vụ dịch thuật của mình (theo sự chấp thuận của khách hàng) và hoàn thành nhiều đầu ra hơn trong thời gian ngắn hơn.

Đồng thời, bạn cũng có thể chuẩn bị hiệu quả cho các tác vụ biên tập bài trong tương lai. Để biên tập thành công ban đầu có thể khá khó khăn và đòi hỏi phải thực hành đủ nhiều. Để thực sự làm việc năng suất, bạn cần phải dịch nhanh hơn hai đến ba lần. Theo KantanMT, sản lượng hàng ngày sẽ phải lên tới khoảng 7.000 từ. Để đạt được tốc độ này, bạn nên thực hành biên tập một thời gian trước khi cung cấp dịch vụ cho khách hàng. Bằng cách kết nối hệ thống dịch máy với Across Translator Edition hoặc một công cụ CAT khác, bạn có thể tìm hiểu và thực hành biên tập bài trong khi xử lý các tác vụ dịch thuật khác của mình.

Mẹo 2: Tiếp cận mở với chủ đề biên tập

Doanh nghiệp thường sử dụng dịch máy để tiết kiệm chi phí dịch thuật và đẩy nhanh quá trình. Một khía cạnh khác là số lượng nội dung ngày càng tăng, vè không còn cách nào khác để sử lý chúng ngoài việc dịch máy.

Thông thường, các văn bản tiếng nước ngoài chỉ cần được hiểu đại khái và do đó phù hợp với dịch máy. Ví dụ, đây có thể là trường hợp khi người quản lý dự án Đức nhận được e-mail từ một đồng nghiệp người Pháp và chỉ muốn biết nó nói về cái gì. Trường hợp này có thể không quá quan trọng nếu cấu trúc câu không hoàn toàn chính xác hoặc nếu văn bản có lỗi ngữ pháp. Tuy nhiên, nếu một văn bản dịch máy sẽ được xuất bản, bạn bắt buộc phải nâng cao chuyên môn của mình. Khách hàng của bạn sẽ đánh giá cao lời khuyên của bạn liên quan đến biên tập bài. Cung cấp cho khách hàng của bạn thông tin thực tế về khối lượng công việc và phản hồi trung thực về các dự án. Đối với nhiều khách hàng, biên tập văn bản là một vùng lãnh thổ chưa được khám phá. Vì chỉnh sửa hậu kỳ vẫn là một dịch vụ tương đối mới, nên vẫn chưa có quá nhiều chuyên gia trên thị trường. Vì vậy, cơ hội để bạn có được khách hàng và dự án mới là tương đối lớn.

Giao tiếp cởi mở, trung thực là một yếu tố quan trọng khác để đảm bảo sự thành công trong hợp tác của bạn với khách hàng. Ví dụ, chất lượng cuối cùng của bản dịch nên được xác định trước khi dự án bắt đầu.

Hãy nhớ rằng bạn có quyền kiểm soát công việc của bạn và có thể quyết định mình sẽ có thể chấp nhận điều kiện gì. Bạn là chuyên gia, và bạn có chuyên môn cần thiết để quyết định xem một dự án có đáng để nhận hay không. Hãy nhớ rằng: Nếu đầu ra kém, bạn sẽ không thể đạt được tốc độ chỉnh sửa cần thiết. Do đó, hãy xem xét trước loại văn bản nào phù hợp với dịch máy và loại nào không phù hợp. Ví dụ, các câu ngắn, đã được chuẩn hóa có thể dễ dàng được dịch bởi các hệ thống. Theo đó, MT đặc biệt phù hợp cho các văn bản kỹ thuật. Ngược lại, hệ thống MT sẽ gặp khó khăn với nội dung sáng tạo.

Vì lý do này, dịch máy không được khuyến nghị cho các văn bản được mang đặc trưng riêng và đòi hỏi khắt khe hơn, ví dụ: Tiếp thị hoặc văn bản văn học. Hãy cung cấp cho khách hàng của bạn thông tin phản hồi cần thiết trong trường hợp bạn từ chối một dự án do chất lượng kém. Dựa trên phản hồi này, khách hàng có thể điều chỉnh các quy trình của mình hoặc giới thiệu các bước bổ sung để cải thiện chất lượng dịch máy, cho phép bạn chấp nhận các dự án trong tương lai. Do đó, sự tương tác tốt giữa khách hàng và người dịch có thể mang lại một tình huống đôi bên cùng có lợi.

Mẹo 3: Hiểu về dịch máy

Như đã đề cập trước đây, bạn có thể trở thành một chuyên gia biên tập bằng cách biết càng nhiều càng tốt về dịch máy. Ví dụ: bạn nên biết các hệ thống khác nhau hoạt động như thế nào và làm thế nào các doanh nghiệp có thể chuẩn bị các văn bản của họ để dịch máy.

Mặc dù dịch máy nơ-ron đang ngày càng phổ biến, nhưng khi biết những điều cơ bản của các hệ thống thống kê và dựa trên quy tắc vẫn sẽ tốt hơn cả

Dịch máy dựa trên quy tắc

Cách tiếp cận dựa trên quy tắc là phương pháp MT cơ bản nhất. Quá trình phát triển của một hệ thống dựa trên quy tắc thường rất tốn kém và mất thời gian, vì mọi đặc thù ngôn ngữ cần phải được nhập bằng tay. Vì lý do này, phương pháp này đang dần bị từ bỏ. Tuy nhiên, cần lưu ý rằng dịch máy dựa trên quy tắc cung cấp các đề xuất thuật ngữ tốt, vì hệ thống đã được “học” những từ chuyên môn trước đó. Hơn nữa, các bản dịch luôn luôn hoàn chỉnh, và kết quả có thể dự đoán được. Nhược điểm chính là các bản dịch là giọng văn rất máy móc, và cấu trúc câu không được trình bày hiệu quả.

Dịch máy thống kê

Dịch máy thống kê là phương pháp tạo bản dịch trên cơ sở tính toán xác suất. Thông tin cần thiết cho việc này được trích xuất từ ​​ngôn ngữ song ngữ. Vì cấu trúc câu và thuật ngữ khác nhau trong mỗi kho văn bản, đầu ra có thể bị ảnh hưởng bởi sự thiếu nhất quán, và vì thế thường khá khó đọc. Hơn nữa, các hệ thống này nhiều khí tạo ra các bản dịch không đầy đủ, thông tin sai hoặc mắc lỗi viết hoa và chính tả.

Dịch máy nơ-ron

Dịch máy thần kinh dựa trên một mạng lưới nơ-ron nhân tạo (ANN) bắt chước các kết nối nơ-ron trong não. Cách tiếp cận này cũng liên quan đến việc phân tích các khối song song cho bản dịch. Sự khác biệt lớn nhất ở đây là trong ANN, bối cảnh ngữ pháp của các câu được ngầm xem xét. Điều này có nghĩa là các văn bản không được dịch ở cấp độ cụm từ, mà ở cấp độ câu, điều này góp phần rất lớn vào tính dễ đọc của văn bản. Cho đến nay, thách thức lớn nhất của dịch máy nơ-ron là vốn từ vựng còn hạn chế mà các mô hình có thể xử lý (hiện tại 50.000 đến 80.000 từ). Do đó, việc chỉnh sửa bài cần tập trung nhiều vào từ vựng hơn là ngữ pháp. Nhược điểm của phương pháp này cũng giống như các phương pháp dịch máy thống kê. Vì các bản dịch được tạo bằng NMT rất dễ đọc, nên có nguy cơ bị bỏ sót lỗi. Tuy nhiên, dịch máy thần kinh là phương pháp hiện đang mang lại kết quả tốt nhất. Do đó, hãy tập trung hơn vào việc kiểm tra lại văn bản dịch của mình thật kỹ.

Mẹo bổ sung

Chất lượng dịch máy có thể được cải thiện bằng cách biên tập trước. Biên tập trước đề cập đến việc chỉnh sửa văn bản nguồn trước khi nó được gửi cho bản dịch máy. Trình chỉnh sửa trước sẽ giúp giảm thiểu lỗi, loại bỏ sự mơ hồ về ngữ nghĩa và đơn giản hóa cấu trúc câu. Ngoài ra, biên tập trước điều chỉnh văn bản theo hướng dẫn biên tập của công ty và sử dụng ngôn ngữ được kiểm soát. Văn bản được chuẩn bị theo cách không chứa bất kỳ chữ viết tắt, hình ảnh hoặc thẻ nào mà hệ thống dịch máy không thể xử lý chính xác.

Mẹo 4: Phân biệt giữa Biên tập toàn phần và Biên tập bán phần

Không thể xây dựng các hướng dẫn sau chỉnh sửa hợp lệ trên toàn cầu, vì các yêu cầu chất lượng đối với chỉnh sửa hậu kỳ nhẹ và chỉnh sửa hậu kỳ hoàn toàn khác nhau. Chỉnh sửa hậu kỳ nhẹ chỉ sửa các lỗi dễ thấy nhất, trong khi chỉnh sửa hậu kỳ đầy đủ điều kiện văn bản đến mức không còn có thể phân biệt được với bản dịch của con người. Trước khi bắt đầu dự án, khách hàng cần cho người dịch biết loại chỉnh sửa bài nào là bắt buộc. Kết hợp với chất lượng đầu ra, người dịch có thể đánh giá khối lượng công việc của mình.

Câu hỏi nên dùng Biên tập toàn phần và Biên tập bán phần cho bản dịch máy phụ thuộc vào hai yếu tố: chất lượng bản dịch thô và mức chất lượng cần thiết cho văn bản cuối cùng. Nếu chất lượng đầu ra tốt, biên tập bán phần có thể đủ để đạt được chất lượng dịch thuật tương đương của con người.

Để quyết định nên chọn Biên tập toàn phần và Biên tập bán phần, CONVIWORK khuyến nghị bạn hãy tuân theo các nguyên tắc sau:

Biên tập bán phần

  • Xóa hoặc bổ sung thông tin bất cứ khi nào cần thiết.
  • Sửa lỗi ngữ nghĩa trong bản dịch.
  • Sử dụng bản dịch thô càng nhiều càng tốt.
  • Sửa lỗi chính tả.
  • Sửa lại nội dung phản cảm hoặc không phù hợp.
  • Thay đổi cấu trúc câu chỉ khi nó làm suy yếu sự hiểu.
  • Đừng thay đổi phong cách ngữ nghĩa.

Biên tập toàn phần

  • Xóa hoặc bổ sung thông tin bất cứ khi nào cần thiết.
  • Sửa lại nội dung phản cảm hoặc không phù hợp.
  • Hợp lý hóa ngữ pháp, cú pháp và ngữ nghĩa của câu.
  • Sử dụng thuật ngữ công ty.
  • Sử dụng bản dịch thô càng nhiều càng tốt.
  • Sửa lỗi chính tả, dấu câu và dấu gạch nối.
  • Điều chỉnh định dạng cho văn bản nguồn.

Mẹo 5: Bao gồm biên tập trong danh mục dịch vụ

Nhiều dịch giả tự hỏi liệu có thể kiếm được nhiều tiền với việc chỉnh sửa bài như với dịch thuật thông thường hay không. Với công việc dịch thuật, bạn có thể tính tỷ lệ phí của bạn trên mỗi từ ở cơ sở đầu ra và thu nhập mục tiêu của bạn. Thông thường, khoảng 50 đến 60 phần trăm tỉ lệ dịch cho mỗi từ được tính vào việc biên tập. Tất nhiên, điều này phụ thuộc rất nhiều vào loại biên tập và chất lượng văn bản cần đạt được. Bạn sẽ dần dần biên tập nhanh hơn và do đó đạt được tốc độ cao hơn mỗi giờ.

Sau đây, Sara Grizzo sẽ cung cấp các mẹo hữu ích để dịch thuật hiệu quả và nhanh hơn. Cô là một dịch giả tự do và biên tập viên, và cô cũng tổ chức các hội thảo và bài giảng về chủ đề biên tập. Nếu bạn biết tiếng Đức, bạn có thể đọc bài viết của cô ấy trên tạp chí “technische kommunikation”, số ra 03/2018.

  • Đầu tiên, xem qua văn bản để phát hiện ra bất kỳ lỗi lặp nào.
  • Sửa lỗi lặp lại bằng cách sử dụng chức năng tìm kiếm và thay thế của công cụ CAT.
  • Sử dụng các chức năng quản lý chất lượng tự động của công cụ CAT để tìm các lỗi phổ biến, chẳng hạn như lỗi viết hoa, lỗi chính tả, lỗi chấm câu, v.v.
  • Sử dụng bàn phím của bạn thay vì chuột. Sử dụng các phím mũi tên và các phím tắt khác nhau, bạn sẽ có thể làm việc nhanh hơn.
  • Trong giai đoạn hậu chỉnh sửa, quá trình quyết định nếu rất ngắn. Vì đầu ra của máy sẽ được sử dụng thường xuyên nhất có thể, các biên tập viên phải hạn chế tự sửa lỗi ngữ pháp hoặc lỗi ngữ pháp khi tham gia Biên tập bán phần.

Mẹo 6: Trở thành một chuyên gia biên tập

Việc tham gia vào các khóa đào tạo rất được khuyến khích khi bạn chuẩn bị trở thành một biên tập viên dày dặn kinh nghiệm. Ví dụ, TAUS cung cấp một khóa học trực tuyến kéo dài sáu giờ và Hiệp hội Phiên dịch và Phiên dịch Liên bang (BDÜ) thường xuyên tổ chức các hội thảo về các chủ đề dịch máy và chỉnh sửa bài.