Truecasing(粵拼:tru1 kei1 sing4)係對某啲文字嘅自然語言處理做嘅一種工序,指「攞一串文字做 input,output 俾出串文字『適當噉大階化咗』嘅樣」。例如[1]
- 攞 my name is john.(「我個名叫阿莊」)呢句嘢做 input;
- Output 要係 My name is John.-英文入面句子最頭嗰個字母要大階,人名最頭字母都係要大階;
Truecasing 呢樣嘢淨係某啲語文嘅自然語言處理先會用到。例如粵文、中文同日文等嘅文字冇大細階呢家嘢,所以唔需要 truecasing。
睇埋
攷