-
Notifications
You must be signed in to change notification settings - Fork 8
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
0 parents
commit 66fa646
Showing
305 changed files
with
10,083,876 additions
and
0 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,14 @@ | ||
# Ignore local settings | ||
/.vscode | ||
.DS_Store | ||
|
||
# Ignore locally-generated dictionary files | ||
*/beta/mabiao | ||
*/beta/schema/yuhao | ||
|
||
# Ignore zip files | ||
*.zip | ||
|
||
# Ignore distributions | ||
/dist | ||
*/dist |
Large diffs are not rendered by default.
Oops, something went wrong.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,14 @@ | ||
<!-- omit in toc --> | ||
# 宇浩输入法方案發佈仓库 | ||
|
||
```txt | ||
宇浩輸入法·傳統漢字简化汉字通打混輸·兼容大陸台灣字形標準·全漢字覆蓋·八萬詞庫·科學高效 | ||
``` | ||
|
||
方案下載:[GitHub 發佈頁](https://github.com/forFudan/yuhao/releases) · | ||
[永硕网盘](http://zhuyuhao.ysepan.com) | ||
|
||
官方網站: [https://shurufa.app](https://shurufa.app) | ||
|
||
官方 QQ 群: [735728797](https://jq.qq.com/?_wv=1027&k=2OYDP4Tk) | ||
官方 TG 群: [yuhaoim](https://t.me/yuhaoim) |
Large diffs are not rendered by default.
Oops, something went wrong.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,7 @@ | ||
# Future improvements | ||
|
||
## 夭 be futher divied as 丿大 | ||
|
||
夭 is not very common. Dividing it in to two parts will not cause too much duplicated words. | ||
|
||
## |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,25 @@ | ||
關於認定「干口」爲「舌」字根的提案 | ||
〔宇委2023地字〕 | ||
|
||
委員會: | ||
|
||
因爲「舌」臺灣字形中爲「干口」。爲了保證字根一致不二拆,故而將「干口」也視爲「舌」字根。 | ||
|
||
「舍」及相關字,現拆爲「人舌」。 | ||
|
||
不影响重码数据。 | ||
|
||
2023年8月16日 | ||
forFudan | ||
|
||
==================== | ||
|
||
委員會意見: | ||
|
||
麥:同意,合理的变形思路 | ||
吉:挺好,就是多了一个二根字 | ||
餅:(雖然没有明確表態,但似乎是同意的) | ||
山:同意 | ||
打:同意 | ||
|
||
其他委員未表態 |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,51 @@ | ||
關於增加「丌(丿改丨)」字根的提案 | ||
〔宇委2023天字〕 | ||
|
||
委員會: | ||
|
||
丌(丿改丨)按規則,應拆作「丅丨」而非「一〢」,不是很直觀。爲了避免修改規則,且達到拆分直觀的目的,爲快的方法就是恢復「丌(丿改丨)」字根。 | ||
|
||
GB0中,影響「亚」「严」及相關字共15個。 | ||
|
||
亚:一业 —— 丌䒑 | ||
严:一业丿 —— 丌䒑丿 | ||
|
||
GBK中,影響「亜」及相關字3個。 | ||
|
||
亜:丅口上 —— 丌口一 | ||
|
||
更改前: | ||
|
||
GB0: 318 | ||
國: 202 | ||
GBK: 5169 | ||
簡動: 0.0489% | ||
繁動: 0.1507% | ||
词動: 1.0902% | ||
|
||
更改後: | ||
|
||
GB0: 318 | ||
國: 202 | ||
GBK: 5178 | ||
簡動: 4.9‱ | ||
繁動: 15.1‱ | ||
词動: 109.7‱ | ||
|
||
請委員會審議。 | ||
|
||
2023年7月7日 | ||
forFudan | ||
|
||
==================== | ||
|
||
委員會意見: | ||
|
||
錢:同意 | ||
吉:含淚贊成 | ||
餅:不含淚贊成 | ||
宋:OK | ||
麥:(雖然没有明確表態,但似乎是同意的) | ||
風:没有意见,同意 | ||
|
||
其他委員未表態 |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,32 @@ | ||
關於增加「壴」字根的提案 | ||
〔宇委 2023 玄字〕 | ||
|
||
委員會: | ||
|
||
因「壴」部首十分常見,對其分散拆分會造成「GLUL」編碼集中了18個漢字。故請考慮增加「壴」字根,碼位「Dd」。 | ||
|
||
GB0中,「喜嘉」不再重碼,「涛澍」重碼。 | ||
|
||
國字中,「喜嘉膨彫」不再重碼。 | ||
|
||
更改後: | ||
|
||
GB0: 320 | ||
國: 198 | ||
GBK: 5164 | ||
簡動: 4.3‱ (-0.6‱) | ||
繁動: 14.3‱ (-0.8‱) | ||
|
||
請委員會審議。 | ||
|
||
2023年8月16日 | ||
forFudan | ||
|
||
==================== | ||
|
||
委員會意見: | ||
|
||
雲:加加加 | ||
山:同意 | ||
打:同意 | ||
麥:我附議 |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,11 @@ | ||
--- | ||
layout: default | ||
title: 相关文章 | ||
nav_order: 51 | ||
has_children: true | ||
--- | ||
|
||
<!-- omit in toc --> | ||
# 相关相关文章 | ||
|
||
这里呈现一些同宇浩输入法相关的相关文章。 |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,22 @@ | ||
--- | ||
title: 背景故事 | ||
layout: default | ||
parent: 相关文章 | ||
nav_order: 81 | ||
--- | ||
|
||
# 背景故事 | ||
|
||
制作宇浩输入法,有几个契机:一个是十年前我写下[《上海话简明教程》](https://zhuanlan.zhihu.com/p/615631608)的时候,遇到了一个情况:有时候我脑海里想的是方言,但用拼音输入的时候,往往会卡壳或者错误。当时的我意识到**字形输入法**的重要性,于是部分使用了仓颉和五笔字形。 | ||
|
||
另一个契机是两年前,我开始写一本古典章回体小说,里面有大量的半文半白的句子,以及古典诗词。使用拼音和双拼,需要不断翻页找字,影响思维的连贯性。这更坚定了我完全使用形码进行创作的决心。 | ||
|
||
第三个契机是我在日常生活中,会大量使用简化字和繁体字:使用简化字同身边人交流,同时使用繁体字进行文学创作。因为我用笔写字的时候也使用陆标繁体,我并不需要输入法为我进行简繁转换。同时,简繁转换一对多的特点、不同标准下的字形有差异,导致转换往往会发生错误。我希望有这样一种输入法,能够分离繁简汉字,如同写字一样,想打繁体打繁体,想打简体打简体。 | ||
|
||
三个契机,也道出了我的三个需求:一、我需要一个不依赖于读音的输入法,也就是字形输入法。二、这个输入法的重码率要低,让我不用选字,流畅地输入。三、这个输入法能够做到繁简汉字分离,一字一码,不存在繁简共码现象。 | ||
|
||
市面上的输入法,满足上述三个条件的,在当时只有「仓颉」和「徐码」。因为仓颉是五码定长,没有简码和词语输入,所以效率不是很高。所以,我最终选择使用徐码,一年中,我定制了自己的 Rime 方案,还进行了全汉字的拆分。 | ||
|
||
使用繁体字写了一百万字的古典章回体小说后,我深感具备繁简通打能力的字形输入法妙不可言。当前市面上允许**繁简通打**的**四码定长**的字形输入法只有徐码,但它需要判断主副根,且回头码有时占据第四码,对于复杂汉字的拆分不是特别顺畅。基于这个原因,我决定暂时放下小说创作,使用 Python 制作一款在繁体、简体、繁简混合,这三种文本模式下都能进行盲打的方案。 | ||
|
||
特别的,我希望它能够做到规则简明、常用繁简字闭眼盲打、大字集检字方便。经过了一系列调试和改进,在同好们的支持和鼓励下,这款输入法终于大功告成。在此,需要感谢所有帮助过我,给我提过宝贵意见和建议的诸位同好。感谢五笔字型和郑码这两个形码界的里程碑,它们的很多理念被沿用。感谢徐码,它是第一个将繁简通打引入四码定长的方案,它的繁简混合低重奠定了宇浩输入法的高起点。 |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,199 @@ | ||
--- | ||
title: 常见形码输入方案编码规则 | ||
layout: default | ||
parent: 相关文章 | ||
nav_order: 2 | ||
--- | ||
|
||
<!-- omit in toc --> | ||
# 常见形码输入方案编码规则 | ||
{: .no_toc } | ||
|
||
朱宇浩 2023年6月7日于鹿特丹 | ||
原文链接:[https://zhuanlan.zhihu.com/p/635435491](https://zhuanlan.zhihu.com/p/635435491) | ||
未经允许,不得转载 | ||
|
||
<details open markdown="block"> | ||
<summary> | ||
目录 | ||
</summary> | ||
{: .text-delta } | ||
1. TOC | ||
{:toc} | ||
</details> | ||
|
||
## 简介 | ||
|
||
本文集中介绍常见形码方案的编码规则,以供形码使用者参考,供新入门形码的朋友学习。同时,我还对部分输入法编写了「编码规则单行定义」,用以辅助新手快速记忆编码规则。 | ||
|
||
各输入方案存在明确或非明确的借鉴关系,但先起者不可能借鉴后来者。因此本文按时间进行排序,或可表明源流。 | ||
|
||
以应部分输入法作者要求,其输入法编码规则不列入本文。 | ||
|
||
## 定义 | ||
|
||
假设一个汉字可以被拆分为若干字根(码元、基根),每个字根都有一个编码(区码、大码),那么该编码用大写拉丁字母 ABCD...WXYZ 编号。特别地,Y和Z用来强调「倒数第X根」这个属性。 | ||
|
||
如果字根存在第二编码(位码、小码),那么该编码用对应的小写拉丁字母ABCD...WXYZ 编号。 | ||
|
||
如果字根存在第三编码,那么该编码依旧用小写拉丁字母表示。 | ||
|
||
一般地,可以将一个字根的编码写为 Aa。如果它是单编码字根,则可认为 a 是个空集 ""。 | ||
表示字形结构编码,记为Ω。 | ||
|
||
表示字根笔画,使用小写希腊字母αβ...ω。特别地,ω用来强调「倒数第一笔画」这个属性。 | ||
|
||
如果输入法使用特定字母占位,则在字母外加圆圈,如:Ⓐⓥ。 | ||
|
||
## 各输入法编码规则 | ||
|
||
### 五笔字形(1983年8月) | ||
|
||
最多取四根,字根编码为 A,单字编码规则: | ||
|
||
- 单字根字 | ||
- 代表字根 AAAA | ||
- 非代表字根 Aαβω | ||
- 多字根字 | ||
- 两字根字 AZΩ | ||
- 三字根字 ABZΩ | ||
- 四字根及以上字 ABCZ | ||
|
||
### 郑码(1983年8月) | ||
|
||
最多取四根,字根分为主副根: | ||
|
||
- 第一主根编码 A | ||
- 第二主根编码 Aⓓ | ||
- 副根编码 Aa | ||
- 三码根编码 Aaa | ||
|
||
单字编码规则: | ||
|
||
- 单字根字 | ||
- 第一主根 Aⓐ | ||
- 第二主根或副根 Aa | ||
- 三码根 Aaa | ||
- 两字根字 | ||
- 都为第一主根 AZⓥⓥ | ||
- 首根为第一主根 AZz | AZbb | ||
- 末根为第一主根 AaZ | AaaZ | ||
- 都不是第一主根 AaZz | AaaZ | ||
- 三字根字 | ||
- 首根为第一主根 ABZ | ABZz | ||
- 首根为第二主根或副根 AaBZ | ||
- 首根为三码根 AaaZ | ||
- 四字根及以上字 | ||
- 首根为第一主根 ABYZ | ||
- 首根为第二主根或副根 AaYZ | ||
- 首根为三码根 AaaZ | ||
|
||
单行定义版: | ||
|
||
AaaBYZzzⓥⓥ 贯序移除 ⓥ>z>B>Y>a 直到小于等于四码 | ||
|
||
QQ 讨论群: 40737127 | ||
|
||
### 尔雅徐码(2013年3月) | ||
|
||
最多取四根,字根分为主副根: | ||
|
||
- 第一主根编码 Aⓥ | ||
- 第二主根编码 Aⓤ | ||
- 副根编码 Aa | ||
|
||
单字编码规则: | ||
|
||
- 单字根字 Aa | ||
- 两字根字 | ||
- 首根为主根 AZz | ||
- 首根为副根 AZza | ||
- 三字根字 | ||
- 首根为主根 ABZz | ||
- 首根为副根 ABZa | ||
- 四字根及以上字 | ||
- 首根为主根 ABYZ | ||
- 首根为副根 ABZa | ||
|
||
单行定义版: | ||
|
||
ABYZza 贯序移除 z>Y 直到小于等于四码 | ||
|
||
官方 QQ 一群(旧版): 218210590 | ||
官方 QQ 二群(新版): 761401688 | ||
|
||
### 山人全息(2013年3月) | ||
|
||
取全部根,字根编码为 Aa,单字编码规则: | ||
|
||
- 单字根字 Aa | ||
- 多字根字 ABC...WYZza | ||
|
||
单行定义版: | ||
|
||
ABC...XYZza | ||
|
||
### 真码 | ||
|
||
最多取四根,字根分为主副根: | ||
|
||
- 主根编码 A | ||
- 副根编码 Aa | ||
|
||
单字编码规则: | ||
|
||
- 单字根字 | ||
- 常用主根 Aⓘ | ||
- 非常用主根 Aⓘⓘ | ||
- 常用副根 Aa | ||
- 非常用副根 Aaⓘⓘ | ||
- 两字根字 | ||
- 都为主根 AZ | ||
- 首根为主根 AZz | ||
- 末根为主根 AaZ | ||
- 三字根字 | ||
- 首根为主根 ABZ | ABZz | ||
- 首根为副根 AaBZ | ||
- 四字根及以上字 | ||
- 首根为主根 ABCZ | ||
- 首根副根 AaYZ | ||
|
||
单行定义版: | ||
|
||
AaBCZz 贯序移除 z>C>a 直到小于等于四码 | ||
|
||
官方 QQ 群: 567108385 | ||
|
||
### 宇浩输入法(2023年3月) | ||
|
||
<!-- 字根编码为 Aa,单字编码规则: | ||
- 单字根字 | ||
- 代表根 Aaⓕ | ||
- 非代表根 Aaⓕⓕ | ||
- 两字根字 | ||
- 末码为v AZz | ||
- 末码不为v AZza | ||
- 三字根字 ABZz | ||
- 四字根及以上字 ABCZ --> | ||
|
||
最多取四根,字根编码为 Aa,单字编码规则: | ||
|
||
- 单字根字 | ||
- 代表根 Aaa | ||
- 非代表根 Aaaa | ||
- 两字根字 AZza | ||
- 三字根字 ABZz | ||
- 四字根及以上字 ABCZ | ||
|
||
单行定义版: | ||
|
||
ABCZza 贯序移除 a>z 直到小于等于四码 | ||
|
||
或: | ||
|
||
ABCZza\[:4\] | ||
|
||
[宇浩输入法官网](https://yuhao.forfudan.com/) · | ||
官方 QQ 群: [735728797](https://jq.qq.com/?_wv=1027&k=2OYDP4Tk) · | ||
官方 Telegram 群: [yuhaoim](https://t.me/yuhaoim) |
Oops, something went wrong.