:::
開發者討論區

[分享] 搞懂了 Writer 的字數統計

discuss pic 2007-07-27 15:57:48
因為寫論文的需要,必須要在相關文件上填寫實際的字數。這下子,還真的是一個大挑戰,因為,Writer跟MS Offiice算出來的,怎麼樣都不一致。花了點時間,終於搞懂OOo的邏輯。必須承認的是,OOo真的必須要改進這一個功能。

會不一致的問題,主要出現在數字的部份。例如,一九九八年,或是1999年,在統計時,都會變成2個字。再來,就是括號的使用。如(一),會被判定為是一個字。如果是我書寫的是

刑事訴訟法(簡稱刑訴法)

會背判定為是6個字

這樣的問題,真的蠻嚴重的。不知道應該去那反應?
discuss pic 2007-07-28 06:56:29
中文版的字數統計分成「文字」「字元」兩部份,如果看字元的部份,連標點符號一起算,是沒有錯誤的。至於文字可能是依英文的習慣來算的以空白格當分界。這個問題在base的部份更清楚,應該算是判斷邏輯的一部分吧。

如果能把標點符號當特例處理的話,應該就更符合中文的習慣了。
1067943249
discuss pic 2007-07-30 00:30:36
個人的感覺,OOo好像內建了中文分詞的功能,因此計算出來的兩個數字應該是字元(characters)與字詞(words),翻譯者把 words 那個項目翻譯成文字,是我的誤解嗎? :)
****************************************************
Finjon Kiang / 江明宗
Just This Computer Studio / 就這間電腦工作室
Website: http://olc.tw
****************************************************
:::

誰在線上

9人線上 (7人在瀏覽互動討論區)

會員: 0
訪客: 9

更多…