香港粵語中「係」之用法 : 以依存樹庫為本之量化研究
The use of haih in Hong Kong Cantonese: A quantitative study based on dependency treebank
Research output: Conference Papers (RGC: 31A, 31B, 32, 33) › 32_Refereed conference paper (without host publication) › peer-review
Author(s)
Related Research Unit(s)
Detail(s)
Original language | Chinese (Traditional) |
---|---|
Publication status | Published - 13 Apr 2019 |
Conference
Location | The Hong Kong Polytechnic University |
---|---|
Place | China |
City | Hong Kong |
Period | 13 April 2019 |
Link(s)
Permanent Link | https://scholars.cityu.edu.hk/en/publications/publication(5d5997cc-c523-477b-a7e4-a0e46648f434).html |
---|
Abstract
本研究旨在以粵語依存樹庫作為研究材料,並以張洪年(2007)為基礎,作為首個對香港粵語中「係」的用法之量化研究,並由此帶出依存樹庫於研究粵語句法之價值。
粵語標記語料庫(如香港粵語語料庫)之出現促使量化句法研究突飛猛進,最重要之原因莫過於詞類標記對區分同音詞及同形詞不同之義項起着不少幫助。例如欲分析「好」 於粵語作為副詞及形容詞之分布概況及其用法,祇要於語料庫搜尋片刻,所需例句卽湧泉而出,此非無標記之資料庫所能及。然而,以詞類標記分辨義項祇適用於詞義虛化簡單之 情況,當分析義項繁多之同音詞,例如「係」時,「香港粵語語料庫」一概標成動詞,並無區分不同義項之用法,詞類標記顯得幫助不大。
探索如何以依存樹庫有效分析漢語方言尚在起步階段,如黃得森、李思源(2017)及黃得森等(Wong et al. 2017)曾以國粵平行依存樹庫比較粵語對白與書面語字幕之句法及 體裁差異。此樹庫所收集之語料有不同體裁,含創意煤體學生所拍攝之微電影、立法會辯 論等。本研究所用之樹庫主要按泛用依存(Universal Dependency)之標註方式(Leung et al. 2016)而建立,含一千零四句句子,共 13 918 詞,計 18 637 字,平均句長為 13.9 詞、18.6 字。
搜尋結果顯示本樹庫含 412 個「係」,按特定語法環境而自動分類之結果如下,亦與張洪年(2007:386−389)之分類方法比照:
------------------------------------------------------------------
用法 微電影 (109) 立法會辯論(303) 張洪年
繫詞+體詞 36 (33%) 45 (15%) 1 相等 2 隸屬 3 關係 4 存在
繫詞+形容 6 (6%) 11 (4%) ?5「係……嘅」
繫詞+句末 31 (28%) 4 (1%) ?9 嘆詞
焦點/填空 29 (27%) 239 (79%) 6 語氣 8 兼語
嘆詞 3 (3%) / 9 嘆詞
省畧 4 (4%) 1 (.3%) ?6 語氣 8 兼語
其他 / 3 (1%)
/ / 7 容認:「係就係」10 凡
---------------------------------------------------------------
本研究發現於微電影中,「係」之用法主要集中在三個類別;而於立法會辯論中,則泰半用作表示焦點或填空之用,表示確認或否定之「繫詞+句末助詞」結構十分罕見。此區別突顯出「係」之用法於有規畫與無規畫言語中存在着顯著差異。
Research Area(s)
- 语料库, 依存树库, 量化研究, 粤语句法, 系词
Bibliographic Note
Citation Format(s)
2019. Paper presented at The Nineteenth Workshop on Cantonese, Hong Kong, China.
Research output: Conference Papers (RGC: 31A, 31B, 32, 33) › 32_Refereed conference paper (without host publication) › peer-review