我們的服務符合學術規范和道德
專業 高端讓您使用時沒有后顧之憂
來源:期刊VIP網所屬分類:免費文獻發布時間:2021-06-05瀏覽:次
摘要:為保證機器翻譯準確性,本文提出了基于短語翻譯模型的英語翻譯計算機智能校對方法,通過發現可代替待校對詞匯的正確詞匯,以實現英語翻譯的自動智能校對。同時詳細設計了英語翻譯計算機智能校對具體流程,分析了基于最大熵模型的分詞模式。最后通過計算機智能校對代碼實現與測試,得出結論,英語翻譯結果校對之前準確率最高只能達到72.9%,而通過英語翻譯計算機智能校對方法完成校對之后,準確率全部保持于99.0%以上,二者準確率差異顯著,表明基于短語翻譯模型的英語翻譯計算機智能校對方法具有顯著有效性與良好穩定性,值得大力推廣與應用。
關鍵詞:短語翻譯模型:英語翻譯;計算機,智能校對
Abstract: In order to ensure the accuracy of machine translation, this paper proposes an intelligent proofreading method of English translationlbased on phrase translation model. By finding the correct words that can replace the words to be proofread, the automatic intelligent proofreading of English translation can be realized. At the same time, the specific process of intelli-
gent proofreading of English translation computer is designed in detail, and the word segmentation mode based on the maximum entropy model is analyzed. Finally, through the implementation and test of the computer intelligent proofread-
ing code, it is concluded that the highest accuracy rate of English translation results can only reach 72.9% before proof-
reading, but after the completion of proofreading by the computer intelligent proofreading method of English translation. the accuracy rate is all kept above 99.0%. The difference between the two accuracy rates is significant, which shows that the computer intelligent proofreading method of English translation based on the phrase translation model is effective. It has significant effectiveness and good stability, and is worth promoting and applying
Key words: phrase translation model; English translation; computer; intelligent proofreading
1引言
譯文質量是衡量英語翻譯結果的重要標準,主要通過譯文字符或拼寫錯誤、表達不一致、詞法語法錯誤等加以表征。目前除機器翻譯之外,各式各樣的計算機輔助翻譯工具如雨后春筍不斷衍生,很多企業研發了與自身需要相符的輔助翻譯工具,但是工具過于側重于翻譯準確性,產品輕量級,良好使用體驗等,在一定程度上忽視了譯文質量,導致后期需耗費大量人工進行校對。而人工校對存在既有缺陷,即速度慢、工作量大,由此便衍生了各種英語翻譯計算機智能校對方法。
斯·勞格勞通過基于字形與語音的詞法分析器設計了以不確定有限自動機與有限自動機為載體的自動拼寫校對算法;趙軍基于音節設計了統計語言模型的自動校對方法,著重分析了模型設計與可行性;冉婕與漆麗娟開發了基于語義與統計的英文機器翻譯改進方法,通過構建英文模型與語義分析模型獲取約束規則語義的規則,以此改進優化英文機器翻譯,此方法雖然時間復雜度偏低,卻難以建立精確的語法規則庫,翻譯效果相對較差;馮志偉通過基于短語與句法的英語翻譯校對系統,對英語翻譯結果進行校對分析,注重短語與句法精確性,但是忽視了語境連貫性"。在此基礎上,本文基于短語翻譯模型提出了英語翻譯計算機智能校對方法。
2英語翻譯計算機智能校對方法設計不同形式文本的轉換時英語翻譯與翻譯校對的共性,所以英語翻譯計算機智能校對流程即面向待翻譯語句進行翻譯,比較并替換校對結果與翻譯結果,從而實現智能化校對。
設定K為英語翻譯錯誤結果,P為英語翻譯正確結果,實現從K向P的轉換,便是英語翻譯校對?;诟倪M短語翻譯模型的計算機翻譯方法即:
E(P')代表已校對詞匯。
通過機器翻譯所獲取的英語翻譯結果中詞匯翻譯精確性需提高,而計算機智能翻譯校對方法注重詞匯翻譯精確性,所以,基于公式(1)優化改進實現計算機智能校對,即:
在英語翻譯計算機智能校對方法闡述中,以K代表待校對詞匯,P'代表已校對詞匯。假設待校對詞匯中包含q個字符,以K9代表,字符分別對應短語翻譯模型中詞匯,且在已校對詞匯中包含1個字符,以P,"代表。假設劃分K,為隨機d個字符串,以K,"代表,字符串分別對應短語翻譯模型中短語。相應的,待校對詞匯生成的校對詞匯包括d個字符串,以P,"代表。綜述可獲得公式(2)擴展模式,即:
英語翻譯計算機智能校對時,著重尋求待校對詞匯的最佳劃分方式,并詳細校對劃分結果,從而獲得P'排列順序的校對結果,通過上式所描述方法發現與待校對詞匯相應的詞匯P,從而完成英語翻譯計算機智能校對2。
3英語翻譯計算機智能校對流程設計基于短語翻譯模型的英語翻譯計算機智能校對流程設計主要包含計算機翻譯與智能校對兩部分。
就翻譯而言,在系統接收輸入源文本之后,進行分句預處理分析,分句結果應保持整句或者短語狀態,以其為檢索單元輸入檢索?;跀祿炱ヅ渑c所尋短語類似的短語,將其與對應譯文同時返回,并根據相似度進行排序。為有效提升檢索效率與準確度,且便于評估相似度,系統通過輔助翻譯記憶庫索引源文本與譯文相應語料庫。此外,翻譯人員所翻譯的短語可能與其他翻譯員曾翻譯的短語存在較高相似度,或受上下文語境影響,翻譯人員所翻譯短語在文本后續部分中出現大量類似復現,所以需索引儲存已翻譯短語"。
就校對而言,加載待校對的源文本-譯文本,可通過數據庫讀取。面向文本,先分句處理,切分源文本與已翻譯目標文本為短語。在翻譯時切分文本遵循切分為最簡短語言片段的原則,而在校對時文本需切分為短語。英文文本的空格為自然分隔符號,所以不需分詞處理,只需對中文分句文本進行分詞處理既可。中文分詞方式各式各樣,本文選擇基于最大熵模型的中文分詞模式。文本分詞之后,針對命名實體識別可解析出名詞或短語,以此信息作為英漢詞匯對齊的錨點。同時面向文本標注詞性,以便于識別出形容詞與數詞等成分,其中數詞作為文本片段的關鍵信息,實現英漢詞匯對齊;形容詞與副詞是豐富短語片段情感色彩的重要載體,也是英漢詞匯對齊的重要標志。
在文本片段完成以上處理之后,成為已劃分詞邊界,且詞匯、短語已通過命名實體識別與詞性標注的短語片段集,然后開始提出短語特征,以實現英漢詞匯對齊。短語特征提取流程具體如圖1所示。
就英漢短語而言,根據以上流程進行特征信息提取,并采用數字化形式加以描述。英漢雙語詞匯對齊時,通過面向各維度增加權重的方式,計算獲取英漢短語的距離,基于動態規劃法對短語距離進行評價,以此把短語最小距離的英漢對齊模型作為最終對齊結果。以尋找源文本與目標文件間對齊的短語,發現可能會存在的不一致性表達,即翻譯時的編輯性錯誤或者漏譯等,以實現錯誤智能檢測。
自下向上的校對模塊體系結構具體如圖2所示。
4基于最大熵模型的分詞模式
通過最大熵模型分詞,本質在于最大熵模型的分類問題。將文本分詞問題轉變為順次掃描字符,在掃描字符后是否分詞或是否到達到詞邊界問題。就詞問題而言,可將最大熵模型輸出明確為兩類,即掃描的位置不是詞邊界,不進行切分,繼續掃描;掃描的位置是詞邊界,進行切分。掃描的字符后續是否需要切分,直接受已出現的,特別是相鄰字符的影響。
最大熵模型問題是求解基于約束條件可促使熵函數達到最大的隨機變量概率值,則:
T(S)代表熵函數;R,(t)代表隨機變量分布理論期望值;R.(t)代表基于約束條件的期望估計值。通過拉格朗日乘子法求解最優解問題的數學描述,引進了向量參數,以調節特征函數,即約束條件作用強弱。一般情況下,明確向量參數的算法主要是GIS算法與改進IIS算法。通過測試最大熵模型,明確向量參數,并運用到未處理文本,可確定中文字符邊界,從而實現中文分詞"。
5計算機智能校對代碼的實現
基于最大熵模型的分詞模式算法相應的偽代碼,即:
6測試分析
為了進一步測試基于短語翻譯模型的英語翻譯計算機智能校對方法的有效性,進行英語翻譯校對測試分析,詳細記錄測試數據信息,以評估此方法有效性。在測試過程中,選擇800字符校對詞匯,1000篇校對短文,其中校對與識別速率分別為15Kb/s,、20Kb/s,基于此測試集比較分析英語翻譯結果校對前后的準確率,對比結果具體M如圖3所示。
由圖可知,英語翻譯結果校對之前準確率最高只能達到72.9%,而通過英語翻譯計算機智能校對方法完成校對之后,準確率全部保持于99.0%以上,二者準確率差異顯著,這就表明本文提出的英語翻譯計算機智能校對方法具有顯著有效性與穩定性。而就英語翻譯準確率均值可以看出,在校對之前,翻譯結果準確率均值只達到70.0%,而引進英語翻譯計算機智能校對方法之后,翻譯結果準確率均值高達99.4%,提高了29.4%,進一步證明了基于短語翻譯模型的英語翻譯計算機智能校對方法的有效性。
7結束語
綜上所述,本文提出了基于短語翻譯模型的英語翻譯計算機智能校對方法。通過測試表明,英語翻譯結果校對之前準確率相對偏低,而通過英語翻譯計算機智能校對方法完成校對之后,準確率明顯較高,二者準確率差異顯著,說明基于短語翻譯模型的英語翻譯計算機智能校對方法具有顯著有效性與良好穩定性;就英語翻譯準確率均值而言,在校對之前,翻譯結果準確率均值只達到70.0%,而引進英語翻譯計算機智能校對方法之后,翻譯結果準確率提高了29.4%,進而說明了本文提出的英語翻譯計算機智能校對方法的有效性。
參考文獻:
[1]衛娜,英語翻譯軟件視角下的翻譯改正算法研究1J.現代科學儀器,2019(3):15-18.
[2]黃登嫻,英語翻譯軟件翻譯準確性矯正算法設計[J].現代電子技術,2018,41(14):170-172,177.
[3]湘南學院,英語翻譯交流學習臺:CN201720646432.9P].2018-07-17.
[4]蘇傳捷,侯宏旭,楊萍,等,基于統計翻譯框架的蒙古文自動拼寫校對方法J.中文報,2013,27(6):175-179.
[5]劉練.基于WebTM的輔助翻譯工具校對子系統設計與實現D].南京:東南大學,2017.
[6]姜贏,李金威,謝湘貴,等,面向機器翻譯的假朋友語義自動校對[].電子設計工程,2017,25(11):222-26.
[7]崔丹.英語翻譯計算機智能校對系統設計[J].現代電子技術,2019,42(4):179-182,186.
[8]薛鑫·基于機器翻譯模型的漢語近音錯別字校對方法研究D].哈爾濱:黑龍江大學,2017.
期刊VIP網,您身邊的高端學術顧問
文章名稱: 基于短語翻譯模型的英語翻譯計算機智能校對方法
文章地址: http://www.kg120.com/mianfeiwx/57832.html
* 填寫需求信息,或選擇平臺現有SCI/SSCI選題(如下)。