當前位置: 華文問答 > 數位

如何用自然語言處理判斷一句話是否符合中文口語習慣?

2022-01-12數位

用基於自然語言處理的轉譯軟體去轉譯這些句子,跟所謂轉譯腔對比。

原文:His opinion isn't accepted.
轉譯腔:他的意見不被大家接受。
更自然的版本:大家都不接受他的意見。

兩個都腦補了所謂「大家」。沒有上下文,你怎麽知道說話人表示的是個人意見、集體意見還是什麽?若有上下文,這所謂「大家」是一致不接受、少數服從多數、由幾個或一個人決定還是怎樣,能隨便用「都」嗎?

原文:I saw a girl who talks and looks like your sister.
轉譯腔:我看到一個說話像且長得也像你姐妹的女生。
更自然的版本:我看到一個說話像你姐妹的女生,而且她們長得也很像。

「你姐妹」這詞就很轉譯腔,沒上下文就敢腦補「大家」的話,怎麽不補是姐姐還是妹妹呢?

原文:When you finish the draft, send it to me.
轉譯腔:當你寫完稿子的時候,把它寄給我吧。
更自然的版本:稿子寫完後就寄給我吧。

在一個機械能寫稿子的時代,去掉「你」真的沒有改變原意麽。

對「轉譯腔」的刻板印象有些已經落伍了,有些還是正在進行時。

要註意所謂「更自然的版本」並不一定好。將美麗的姑娘轉譯成可憐的老馬也是這麽來的。