Skip to content

Commit

Permalink
Latest verseion
Browse files Browse the repository at this point in the history
  • Loading branch information
forFudan committed Aug 10, 2024
0 parents commit 66fa646
Show file tree
Hide file tree
Showing 305 changed files with 10,083,876 additions and 0 deletions.
14 changes: 14 additions & 0 deletions .gitignore
Original file line number Diff line number Diff line change
@@ -0,0 +1,14 @@
# Ignore local settings
/.vscode
.DS_Store

# Ignore locally-generated dictionary files
*/beta/mabiao
*/beta/schema/yuhao

# Ignore zip files
*.zip

# Ignore distributions
/dist
*/dist
363 changes: 363 additions & 0 deletions LICENSE.txt

Large diffs are not rendered by default.

14 changes: 14 additions & 0 deletions README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,14 @@
<!-- omit in toc -->
# 宇浩输入法方案發佈仓库

```txt
宇浩輸入法·傳統漢字简化汉字通打混輸·兼容大陸台灣字形標準·全漢字覆蓋·八萬詞庫·科學高效
```

方案下載:[GitHub 發佈頁](https://github.com/forFudan/yuhao/releases) ·
[永硕网盘](http://zhuyuhao.ysepan.com)

官方網站: [https://shurufa.app](https://shurufa.app)

官方 QQ 群: [735728797](https://jq.qq.com/?_wv=1027&k=2OYDP4Tk)
官方 TG 群: [yuhaoim](https://t.me/yuhaoim)
809 changes: 809 additions & 0 deletions committee/discussion/拆分商榷-後來-20231217.txt

Large diffs are not rendered by default.

7 changes: 7 additions & 0 deletions committee/future.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,7 @@
# Future improvements

## 夭 be futher divied as 丿大

夭 is not very common. Dividing it in to two parts will not cause too much duplicated words.

##
Original file line number Diff line number Diff line change
@@ -0,0 +1,25 @@
關於認定「干口」爲「舌」字根的提案
〔宇委2023地字〕

委員會:

因爲「舌」臺灣字形中爲「干口」。爲了保證字根一致不二拆,故而將「干口」也視爲「舌」字根。

「舍」及相關字,現拆爲「人舌」。

不影响重码数据。

2023年8月16日
forFudan

====================

委員會意見:

麥:同意,合理的变形思路
吉:挺好,就是多了一个二根字
餅:(雖然没有明確表態,但似乎是同意的)
山:同意
打:同意

其他委員未表態
Original file line number Diff line number Diff line change
@@ -0,0 +1,51 @@
關於增加「丌(丿改丨)」字根的提案
〔宇委2023天字〕

委員會:

丌(丿改丨)按規則,應拆作「丅丨」而非「一〢」,不是很直觀。爲了避免修改規則,且達到拆分直觀的目的,爲快的方法就是恢復「丌(丿改丨)」字根。

GB0中,影響「亚」「严」及相關字共15個。

亚:一业 —— 丌䒑
严:一业丿 —— 丌䒑丿

GBK中,影響「亜」及相關字3個。

亜:丅口上 —— 丌口一

更改前:

GB0: 318
國: 202
GBK: 5169
簡動: 0.0489%
繁動: 0.1507%
词動: 1.0902%

更改後:

GB0: 318
國: 202
GBK: 5178
簡動: 4.9‱
繁動: 15.1‱
词動: 109.7‱

請委員會審議。

2023年7月7日
forFudan

====================

委員會意見:

錢:同意
吉:含淚贊成
餅:不含淚贊成
宋:OK
麥:(雖然没有明確表態,但似乎是同意的)
風:没有意见,同意

其他委員未表態
Original file line number Diff line number Diff line change
@@ -0,0 +1,32 @@
關於增加「壴」字根的提案
〔宇委 2023 玄字〕

委員會:

因「壴」部首十分常見,對其分散拆分會造成「GLUL」編碼集中了18個漢字。故請考慮增加「壴」字根,碼位「Dd」。

GB0中,「喜嘉」不再重碼,「涛澍」重碼。

國字中,「喜嘉膨彫」不再重碼。

更改後:

GB0: 320
國: 198
GBK: 5164
簡動: 4.3‱ (-0.6‱)
繁動: 14.3‱ (-0.8‱)

請委員會審議。

2023年8月16日
forFudan

====================

委員會意見:

雲:加加加
山:同意
打:同意
麥:我附議
11 changes: 11 additions & 0 deletions docs/articles/articles.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,11 @@
---
layout: default
title: 相关文章
nav_order: 51
has_children: true
---

<!-- omit in toc -->
# 相关相关文章

这里呈现一些同宇浩输入法相关的相关文章。
22 changes: 22 additions & 0 deletions docs/articles/background.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,22 @@
---
title: 背景故事
layout: default
parent: 相关文章
nav_order: 81
---

# 背景故事

制作宇浩输入法,有几个契机:一个是十年前我写下[《上海话简明教程》](https://zhuanlan.zhihu.com/p/615631608)的时候,遇到了一个情况:有时候我脑海里想的是方言,但用拼音输入的时候,往往会卡壳或者错误。当时的我意识到**字形输入法**的重要性,于是部分使用了仓颉和五笔字形。

另一个契机是两年前,我开始写一本古典章回体小说,里面有大量的半文半白的句子,以及古典诗词。使用拼音和双拼,需要不断翻页找字,影响思维的连贯性。这更坚定了我完全使用形码进行创作的决心。

第三个契机是我在日常生活中,会大量使用简化字和繁体字:使用简化字同身边人交流,同时使用繁体字进行文学创作。因为我用笔写字的时候也使用陆标繁体,我并不需要输入法为我进行简繁转换。同时,简繁转换一对多的特点、不同标准下的字形有差异,导致转换往往会发生错误。我希望有这样一种输入法,能够分离繁简汉字,如同写字一样,想打繁体打繁体,想打简体打简体。

三个契机,也道出了我的三个需求:一、我需要一个不依赖于读音的输入法,也就是字形输入法。二、这个输入法的重码率要低,让我不用选字,流畅地输入。三、这个输入法能够做到繁简汉字分离,一字一码,不存在繁简共码现象。

市面上的输入法,满足上述三个条件的,在当时只有「仓颉」和「徐码」。因为仓颉是五码定长,没有简码和词语输入,所以效率不是很高。所以,我最终选择使用徐码,一年中,我定制了自己的 Rime 方案,还进行了全汉字的拆分。

使用繁体字写了一百万字的古典章回体小说后,我深感具备繁简通打能力的字形输入法妙不可言。当前市面上允许**繁简通打****四码定长**的字形输入法只有徐码,但它需要判断主副根,且回头码有时占据第四码,对于复杂汉字的拆分不是特别顺畅。基于这个原因,我决定暂时放下小说创作,使用 Python 制作一款在繁体、简体、繁简混合,这三种文本模式下都能进行盲打的方案。

特别的,我希望它能够做到规则简明、常用繁简字闭眼盲打、大字集检字方便。经过了一系列调试和改进,在同好们的支持和鼓励下,这款输入法终于大功告成。在此,需要感谢所有帮助过我,给我提过宝贵意见和建议的诸位同好。感谢五笔字型和郑码这两个形码界的里程碑,它们的很多理念被沿用。感谢徐码,它是第一个将繁简通打引入四码定长的方案,它的繁简混合低重奠定了宇浩输入法的高起点。
199 changes: 199 additions & 0 deletions docs/articles/coding.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,199 @@
---
title: 常见形码输入方案编码规则
layout: default
parent: 相关文章
nav_order: 2
---

<!-- omit in toc -->
# 常见形码输入方案编码规则
{: .no_toc }

朱宇浩 2023年6月7日于鹿特丹
原文链接:[https://zhuanlan.zhihu.com/p/635435491](https://zhuanlan.zhihu.com/p/635435491)
未经允许,不得转载

<details open markdown="block">
<summary>
目录
</summary>
{: .text-delta }
1. TOC
{:toc}
</details>

## 简介

本文集中介绍常见形码方案的编码规则,以供形码使用者参考,供新入门形码的朋友学习。同时,我还对部分输入法编写了「编码规则单行定义」,用以辅助新手快速记忆编码规则。

各输入方案存在明确或非明确的借鉴关系,但先起者不可能借鉴后来者。因此本文按时间进行排序,或可表明源流。

以应部分输入法作者要求,其输入法编码规则不列入本文。

## 定义

假设一个汉字可以被拆分为若干字根(码元、基根),每个字根都有一个编码(区码、大码),那么该编码用大写拉丁字母 ABCD...WXYZ 编号。特别地,Y和Z用来强调「倒数第X根」这个属性。

如果字根存在第二编码(位码、小码),那么该编码用对应的小写拉丁字母ABCD...WXYZ 编号。

如果字根存在第三编码,那么该编码依旧用小写拉丁字母表示。

一般地,可以将一个字根的编码写为 Aa。如果它是单编码字根,则可认为 a 是个空集 ""。
表示字形结构编码,记为Ω。

表示字根笔画,使用小写希腊字母αβ...ω。特别地,ω用来强调「倒数第一笔画」这个属性。

如果输入法使用特定字母占位,则在字母外加圆圈,如:Ⓐⓥ。

## 各输入法编码规则

### 五笔字形(1983年8月)

最多取四根,字根编码为 A,单字编码规则:

- 单字根字
- 代表字根 AAAA
- 非代表字根 Aαβω
- 多字根字
- 两字根字 AZΩ
- 三字根字 ABZΩ
- 四字根及以上字 ABCZ

### 郑码(1983年8月)

最多取四根,字根分为主副根:

- 第一主根编码 A
- 第二主根编码 Aⓓ
- 副根编码 Aa
- 三码根编码 Aaa

单字编码规则:

- 单字根字
- 第一主根 Aⓐ
- 第二主根或副根 Aa
- 三码根 Aaa
- 两字根字
- 都为第一主根 AZⓥⓥ
- 首根为第一主根 AZz | AZbb
- 末根为第一主根 AaZ | AaaZ
- 都不是第一主根 AaZz | AaaZ
- 三字根字
- 首根为第一主根 ABZ | ABZz
- 首根为第二主根或副根 AaBZ
- 首根为三码根 AaaZ
- 四字根及以上字
- 首根为第一主根 ABYZ
- 首根为第二主根或副根 AaYZ
- 首根为三码根 AaaZ

单行定义版:

AaaBYZzzⓥⓥ 贯序移除 ⓥ>z>B>Y>a 直到小于等于四码

QQ 讨论群: 40737127

### 尔雅徐码(2013年3月)

最多取四根,字根分为主副根:

- 第一主根编码 Aⓥ
- 第二主根编码 Aⓤ
- 副根编码 Aa

单字编码规则:

- 单字根字 Aa
- 两字根字
- 首根为主根 AZz
- 首根为副根 AZza
- 三字根字
- 首根为主根 ABZz
- 首根为副根 ABZa
- 四字根及以上字
- 首根为主根 ABYZ
- 首根为副根 ABZa

单行定义版:

ABYZza 贯序移除 z>Y 直到小于等于四码

官方 QQ 一群(旧版): 218210590
官方 QQ 二群(新版): 761401688

### 山人全息(2013年3月)

取全部根,字根编码为 Aa,单字编码规则:

- 单字根字 Aa
- 多字根字 ABC...WYZza

单行定义版:

ABC...XYZza

### 真码

最多取四根,字根分为主副根:

- 主根编码 A
- 副根编码 Aa

单字编码规则:

- 单字根字
- 常用主根 Aⓘ
- 非常用主根 Aⓘⓘ
- 常用副根 Aa
- 非常用副根 Aaⓘⓘ
- 两字根字
- 都为主根 AZ
- 首根为主根 AZz
- 末根为主根 AaZ
- 三字根字
- 首根为主根 ABZ | ABZz
- 首根为副根 AaBZ
- 四字根及以上字
- 首根为主根 ABCZ
- 首根副根 AaYZ

单行定义版:

AaBCZz 贯序移除 z>C>a 直到小于等于四码

官方 QQ 群: 567108385

### 宇浩输入法(2023年3月)

<!-- 字根编码为 Aa,单字编码规则:
- 单字根字
- 代表根 Aaⓕ
- 非代表根 Aaⓕⓕ
- 两字根字
- 末码为v AZz
- 末码不为v AZza
- 三字根字 ABZz
- 四字根及以上字 ABCZ -->

最多取四根,字根编码为 Aa,单字编码规则:

- 单字根字
- 代表根 Aaa
- 非代表根 Aaaa
- 两字根字 AZza
- 三字根字 ABZz
- 四字根及以上字 ABCZ

单行定义版:

ABCZza 贯序移除 a>z 直到小于等于四码

或:

ABCZza\[:4\]

[宇浩输入法官网](https://yuhao.forfudan.com/) ·
官方 QQ 群: [735728797](https://jq.qq.com/?_wv=1027&k=2OYDP4Tk) ·
官方 Telegram 群: [yuhaoim](https://t.me/yuhaoim)
Loading

0 comments on commit 66fa646

Please sign in to comment.