维基百科:字词转换/修复请求
|
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
本页面为维基百科:字词转换下属子页面,用于处理各维基计划全域转换和中文维基百科本地全局转换中的所有繁简与地区词错误转换修复的请求。
轉換与修复原理
编辑由於简体中文、繁体中文之间存在一对多现象,即以單一简化字或繁体字來对应多個繁體字或简化字[1][2],因此必須有額外的数据來補足原先丟失的信息。例如,繁體中的“髮”或“發”,在简体下都是“发”。在程序裡,我們有一個默认的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程序遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢?這就要看詞庫而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。
那詞庫是如何创建的呢?我們先有每個字的默认對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含繁體“發”的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的默认對應關係。同样,修復過度轉換也是由上述的方法來處理。
外部連結
编辑错误转换修复请求
编辑 存档 |
---|
繁简转换请求(2004-2014)
错误修复请求(2008-)
|
瑙鲁兹
编辑
请修复简体模式下错误转换:「瑙鲁兹」,正确转换应为「诺鲁兹」。出错页面:設拉子。其他說明:因为全局转换中 諾魯-> 瑙魯 的转换引入。诺鲁兹节或诺鲁孜节是中亚比较重要的节日。另外繁体也不需转换,应为"諾魯茲"。见[1]、[2]、[3]、[4]、[5]--Kethyga(留言) 2024年3月7日 (四) 09:37 (UTC)
- 已修复,去除本规则。已修复于Update 2024-2(Gerrit:1040810),请耐心等待服务器更新。—Chiefwei(论 - 历) 2024年6月9日 (日) 11:35 (UTC)
- 现在只是把香港繁体的规则去掉了,简体的没去掉--屠麟傲血(留言) 2024年6月10日 (一) 01:55 (UTC)
- @Chiefwei,你没修完。--Txkk(留言) 2024年6月15日 (六) 04:20 (UTC)
- 现在只是把香港繁体的规则去掉了,简体的没去掉--屠麟傲血(留言) 2024年6月10日 (一) 01:55 (UTC)
日裡
编辑
请修复繁體模式下错误转换:「日裡」,正确转换应为「日里」。出错页面:日里等大量條目。
此二字似乎是作爲一詞或「這段時日裏」等表述的一部分轉換,但是日里二字在中文維基百科更常見於音譯地名人名中,或者日與前文相連而里作爲後文音譯詞彙的一部分。宜將此條規則從php中去除或使用中文維基百科的轉換表覆蓋。之後也許可以額外將「時日裏」等比較常見且不會過度轉換的詞彙加入轉換規則。——枰(留言) 2024年3月19日 (二) 07:01 (UTC)
- 其他条目,标题中的比如日里县、日里雪冷县、拉维日里、弗拉基米尔·日里诺夫斯基、Special:Search/intitle:"日里"。文本中的,比如臺北縣 (日治時期)中,日里其实是度量单位,2016年夏季奧林匹克運動會中國代表團中“2016年7月18日里约奥运”=>zh-tw:“2016年7月18日裡約奧運”,其他见Special:Search/insource:/日里/(日+专有名词中的里)。
- 想到几个中文可能用到的“冬日里、连日里、整日里、终日里、数日里、春日里、秋日里、夏日里、几日里、十日里、时日里、
一-九日里、工作日里、白日里、节日里、平日里”,其他可见北京大学CCL语料库,不过有些可能非百科式常用词汇,比较像文学类词汇。--Kethyga(留言) 2024年3月19日 (二) 23:06 (UTC)- 可以参考年里/裏/裡、月里,日和年、月的实际用法还有差异,不过最终还得手动复检。--Kethyga(留言) 2024年4月1日 (一) 16:37 (UTC)
- 已修复于Update 2024-2(Gerrit:1040810),请耐心等待服务器更新。—Chiefwei(论 - 历) 2024年6月9日 (日) 11:35 (UTC)
- zh-hk模式下打成春日裡了--屠麟傲血(留言) 2024年6月9日 (日) 15:32 (UTC)
峯
编辑
请修复简体模式下错误转换:「峯」,正确转换应为「峰」。出错页面:金峯山寺。其他說明:峯在《通用规范汉字表》作为峰的异体字,同羣和群。--Kethyga(留言) 2024年4月7日 (日) 09:56 (UTC)
- 異體字是相互的,不等同於繁體字。雖然有些異體關係中存在正體字,但是「峯」並不罕見於簡體中文環境的人名地名專名,不宜統統被「峰」取代。--— Gohan 2024年4月28日 (日) 07:49 (UTC)
- 简体中文环境常见“峯”?“峯”在《通用规范汉字表》中就是“峰”的异体字,繁体字和异体字在《中华人民共和国国家通用语言文字法》的地位是完全一致的,都是限定在一些场合使用(见第十七条),在中维的转换规则自然也应视同繁体字(既是规范汉字又作为另一个字异体字的情况除外,如“喆”“昇”等,但繁体字同有这种情况如“乾”,仍进一步说明它们地位是一致的)。既然异体字“棄”转换为了“弃”,“峯”当然也应转换,正式场合中国大陆也用“林峰”而不用“林峯”([6])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
- 维基的转换规则不会完全拘泥于《通用规范汉字表》规定,因为规定往往是滞后的,当前媒体与社会的用字倾向随时有可能突破(近年甚至出现了黄霄雲这样的极端人名用字,但目前只是孤例)。不过对于本案,仍可继续讨论。—Chiefwei(论 - 历) 2024年6月10日 (一) 03:08 (UTC)
- 感谢阁下提醒!您的回复给了我很大启发。不过……《通用规范汉字表》虽可能滞后,但却是强符合“可供查证”的(以及相对滞后也意味着相对稳定),根据媒体社会用字倾向来决定转换,是否会有原创研究/总结之嫌?比如黄霄云,在今年(2024年)文联旗下中国文艺网中的人名还是“云”而非“雲”([7]),在看不到当事人身份证的情况下,不同可靠来源中有不同用字,该如何定夺呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 文联既不代表在可靠來源中常用,亦非黄霄雲的主人或本人。在簡體中文環境的主流媒體中,「黄霄云」並不比「黄霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
在简体中文环境的主流媒体中,“黄霄云”并不比“黄霄雲”常用。
[來源請求]--自由雨日(留言) 2024年6月29日 (六) 08:43 (UTC)
- 文联既不代表在可靠來源中常用,亦非黄霄雲的主人或本人。在簡體中文環境的主流媒體中,「黄霄云」並不比「黄霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
- 感谢阁下提醒!您的回复给了我很大启发。不过……《通用规范汉字表》虽可能滞后,但却是强符合“可供查证”的(以及相对滞后也意味着相对稳定),根据媒体社会用字倾向来决定转换,是否会有原创研究/总结之嫌?比如黄霄云,在今年(2024年)文联旗下中国文艺网中的人名还是“云”而非“雲”([7]),在看不到当事人身份证的情况下,不同可靠来源中有不同用字,该如何定夺呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 請閣下留意簡體字在維基百科並非只有中國大陸使用——也會影響星馬用字,並區分「應然」與「實然」。維基百科的「應然」取決於現實的「實然」,而不由中國大陸的「應然」決定。另外,對於中國大陸,仍有不少人「名」中違法使用異體字,也曾鬧出不少交通站名借字改地名引發爭議、甚或最終改回異體字原名的新聞。--— Gohan 2024年6月13日 (四) 07:29 (UTC)
- 维基的转换规则不会完全拘泥于《通用规范汉字表》规定,因为规定往往是滞后的,当前媒体与社会的用字倾向随时有可能突破(近年甚至出现了黄霄雲这样的极端人名用字,但目前只是孤例)。不过对于本案,仍可继续讨论。—Chiefwei(论 - 历) 2024年6月10日 (一) 03:08 (UTC)
- 简体中文环境常见“峯”?“峯”在《通用规范汉字表》中就是“峰”的异体字,繁体字和异体字在《中华人民共和国国家通用语言文字法》的地位是完全一致的,都是限定在一些场合使用(见第十七条),在中维的转换规则自然也应视同繁体字(既是规范汉字又作为另一个字异体字的情况除外,如“喆”“昇”等,但繁体字同有这种情况如“乾”,仍进一步说明它们地位是一致的)。既然异体字“棄”转换为了“弃”,“峯”当然也应转换,正式场合中国大陆也用“林峰”而不用“林峯”([6])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
鳽
编辑
请修复大陆简体模式下错误转换:「鳽」,正确转换应为「𫛚」。出错页面:小葦鳽。其他說明:疑似在中日韓統一表意文字擴展區內的部分簡化字有數個並未被順利轉換成對應的繁體,並導致小苇𫛚及小葦鳽不被視作同等詞彙。另外可能一些同樣以鳥部類推簡化的字,如F區「𮭥」也有有類似情況。(但與𫛚字同區的「𫛭」就有成功轉換。)--WiTo🐤💬 2024年4月24日 (三) 08:37 (UTC)
- @T45614631:“𫛚”和“𮭥”属于通用规范汉字表以外的汉字(简称“表外字”)而“𫛭”属于表内字。表内字肯定是得到简化了的,但表外字是否需要类推简化具有争议性,因为中国政府态度模糊并未明言表外字需要或不需要简化(多数实际操作中类推简化了)。我不是要说上述两个字不可以简化,但可能需要更多讨论。可以看这里关于应不应该无限类推简化的一堆文章。另外我想到了植物也有一个“苦蘵”,当中的“蘵”要不要简化也可以讨论一下。--微肿头龙(留言) 2024年5月6日 (一) 09:58 (UTC)
- 好,我去客棧開個話題。--WiTo🐤💬 2024年5月6日 (一) 15:30 (UTC)
- 等待共识,暂不处理。—Chiefwei(论 - 历) 2024年6月9日 (日) 11:35 (UTC)
相信託洛茨基
编辑
请修复臺灣正體模式下错误转换:「相信託洛茨基」,正确转换应为「相信托洛茨基」。出错页面:第一次莫斯科審判。其他說明:信托會轉換為信託,和相信托洛茨基毫無關係--SingBow(留言) 2024年6月11日 (二) 16:43 (UTC)
- 加了分隔。——暁月凛奈 (留言) 2024年6月20日 (四) 00:20 (UTC)
- @暁月凛奈 不止这一处,比如J·R·R·托尔金中的“相信托尔金”,可能需要加一个全局的“相信托-相信托”。--Kethyga(留言) 2024年6月20日 (四) 03:02 (UTC)
- (~)補充:google搜尋結果:site:zh.wikipedia.org "相信託"。--maki※有事請留言 2024年6月21日 (五) 12:59 (UTC)
佔多索夫
编辑
请修复香港繁体模式、澳门繁体模式下错误转换:「佔多索夫」,正确转换应为「占多索夫」。出错页面:奧拉茲·占多索夫。--Txkk(留言) 2024年6月15日 (六) 04:17 (UTC)
祇是
编辑
请修复简体模式下错误转换:「祇是」,正确转换应为「只是」。出错页面:阿尔巴尼亚语。其他說明:单独的祇是多音多义字,但是“祇是”(zhǐshì)非多义词,另外虽然不甚常用,应该不算错。《重編國語辭典修訂本》收录了“祇是”。--Kethyga(留言) 2024年6月15日 (六) 12:17 (UTC)
- 见Wikipedia:繁简体转换请求/增加cn:只tw:祗、祇,另外有“祇要”、“祇有”、“祗是”、“祗要”、“祗有”。祗(Unicode U+7957)、祇(Unicode U+7947)--Kethyga(留言) 2024年6月15日 (六) 12:32 (UTC)
- (~)補充:还有“祇能”“祇须”等
,经常会在讨论页看到某管理员使用“祇”这个字。--自由雨日(留言) 2024年6月21日 (五) 06:21 (UTC) - 神祇是 ——魔琴[身份声明 留言 贡献 新手2023] 2024年6月26日 (三) 12:01 (UTC)
政党
编辑
请修复臺灣正體模式下错误转换:「政党」,正确转换应为「政黨」。出错页面:迪克·肖夫。其他說明:「政党」一詞未在此模式中轉換成「政黨」-- ,這是β衰變和正電子發射,請無視其他能量釋放。 2024年6月17日 (一) 07:29 (UTC)
- 全局中存在“党进->黨進”(党进),很可能需要从全局中去掉该转换。或者可以考虑在本地建立各种于姓、党姓的转换组,需要完善Template:CGroup/姓氏。 --Kethyga(留言) 2024年6月18日 (二) 06:51 (UTC)
冷麵
编辑
请修复繁體模式下错误转换:「冷麵」,正确转换应为「冷面」。出错页面:冷面梟雄、冷面虎等。其他說明:只要頁面以簡體寫成就會發生錯誤。--SingBow(留言) 2024年6月19日 (三) 16:39 (UTC)
漢堡
编辑
请修复简体模式下错误转换:「漢堡」,正确转换应为「漢堡選單」。出错页面:漢堡選單。其他說明:標題被轉換為漢堡--SingBow(留言) 2024年7月3日 (三) 23:14 (UTC)
或特許以,或授權以
编辑
请修复繁體模式下错误转换:「或特許以,或授權以」,正确转换应为「或許可以」。出错页面:维基百科:傀儡调查/案件/Garrett20090。其他說明:「因此,或特許以暫且放過他們一馬」錯誤斷句(或/許可/以),正確斷句應為「或許/可以」。--WiiUf ——青龍出世,傲視蒼穹 2024年7月4日 (四) 04:39 (UTC)
- @WiiUf 已修复。--Kethyga(留言) 2024年7月5日 (五) 08:03 (UTC)
管須蟹
编辑
请修复繁體模式下错误转换:「管須蟹」,正确转换应为「管鬚蟹」。--紺野夢人 2024年7月6日 (六) 16:44 (UTC)