跳转至

概述

简介

五笔字型输入法是王永民1在 1980 年代初期基于汉字字型结构发明的中文输入法,简称“五笔”,也叫“王码五笔”。类似形码输入法包括郑码2、仓颉输入法34

王码五笔版本分为:

  • 86 版五笔(成熟版最早在 1986 年发布,最早的 25 键版本约在 1983 年实现)。86 版常见版本包括:
    • 4.5 版本:最经典和通用的版本,最初仅支持 GB/T2312-1980 中 6 千多字,不支持繁体,目前第三方版本一般已经在大字符集支持;
    • 10830 版:也叫新 86 版,2000 年发布,支持 GB10830-2000 中 2 万多字,适当补充字根并修正 4.5 版中存在争议的末笔不符合国家笔顺规范等问题。
    • 此外还有更早的 86 版 3.X、4.0 版(字根区位、识别码等存在差异)。
  • 98 版(约 1998 年发布):
    • 包括 9801 版、9803 版、9804 版及 9808 版;是五笔版本中最早支持 GB10830 的,对字根(也改叫码元)表调整,优化拆分策略和输入效率。
  • 新世纪版(也叫 06 版,在 2006-2008 间发布)。

版权(专利)问题。王码 86 版和 98 版编码方案专利已经到期(或放弃),可以自由使用,新世纪版本目前仍受到版权限制。

另外官方的王码除了五笔字型,还包括数字王码(5 键、6 键、9 键),基于数字键盘进行字根编码输入,官网提供三版合一的大一统版五笔(收费软件)。

除了王码五笔软件,基于王码方案和编码,衍生了小鸭五笔、极点五笔、海峰五笔等输入法软件,主要优化词库和支持更大的字符集。

基本思想

汉字是“形、音、义”是三者合一的。从音而言,前有注音符号,后有汉语拼音。从形而言,每个汉字皆由若干笔画构成,同时也拆成若干构字部件(其中一些被称为偏旁或部首),最基础的构字部件是笔画。其中偏旁是合字体(形声)等左右构字部分,而今不论上下左右皆称偏旁(radical)。部首(indexing component)是可以成批构字的一部分部件,主要用于查字。根据国家规范《汉字部首表》统计,主部首共有 201 个,附形部首(繁体、变形和从属)共 100 个;传统字书《说文解字》部首 540 个、《康熙字典》部首 214 个。

最简单的形码输入将笔画分类为五类:横(提)、竖、撇、捺(点)、折,然后按笔画顺序输入,特点是方案简单,缺点是编码过长,另外受到笔顺影响。

而单纯使用偏旁部首是无法构成全部字集的,而且偏旁部首数量较多(超过 300),分配的有限的键位上难度较大。一种思路就是将偏旁部首以及独体字等进一步拆分和归纳,结合基本笔画作为补充,在适当控制拆分部件数量的同时,又能涵盖全部字集,进而得到基本构字部件集合,该集合用于编码的基本元素。之后适当编码分配键位,优化重码、人机协调等问题,即可得到一个基础可行的形码输入方案。输入步骤:将单个字根据一定规则拆分能若干部件,找到部件对于按键,输入即可得到汉字。

从输入法设计而言,难点是一如何拆分汉字得到基本部件(即字根尽可能少且能覆盖全),二是如何分配键位,降低重码、方便使用;从学习的角度而言,难点在于如何快速记忆字根并拆字输入。

教程


  1. 王永民(1943-),河南南召人。最初发明的五笔主要支持简体中文(GB 2312)。 

  2. 郑易里(原名郑雨笙,1906—2002,云南玉溪县人)及其女儿郑珑发明,1989 年获得专利权(《字根编码输入法及其设备》),优点是较早支持国家语言文字规范和约 6 万汉字编码。 

  3. 主要在港台等繁体中文地区流行,朱邦复(1937-,生于湖北黄冈县,长于台湾地区)于 1976 年发明,最初仅支持繁体中文。 

  4. 更多形码输入法介绍以及比较可见: 🔗 朱宇浩-常见形码输入方案编码规则🔗 纤夫张/Dieken(Yubao Liu)-中文输入法​列表