关于ibus输入法词库

目前Linux下几个拼音输入法都处于初级的开发阶段,很难说哪个特别成熟,除了老牌的Fctix,基于SCIM平台有默认的智能、巨蟒、SunPinYin,当然还有我用的ibus。SunPinYin是Sun的OpenSolaris里面的一个项目,基于“统计语言模型”,技术刚刚的,据说反应极快,虽然目前功能欠缺,但真让人期待。

默认词库最大的似乎是巨蟒,据说用了sogou早期的词库,但是似乎词库处理上算法有点粗糙,而Fcitx的词库实在太小……ibus算中规中矩,词库不小,不算新,但也很容易让用户上手。

sqlitebrowser

顺便练习下SQL

ibus当然也不完美,比如删词功能就经常不行(Ctrl + num),之前有hao的首选字突然变成了“号”,但明显“好”才更常用,郁闷了几天,安装了sqlitebrowser,打开用户词库,找到“号”把user_freq调回单位数(居然说我输入了几百次,晕!可能某次程序出错多循环了一会。)

盯着词库看挺好玩的,想到如果能导入搜狗词库多好(ibus比较却成语类的词),还顺手照书上例子试了下用Python读取ibus的数据库。没什么意义,当是数据库编程的Hello World吧。

#!/usr/bin/python
 
import sqlite3
 
con = sqlite3.connect('/home/pentie/.ibus/pinyin/user.db')
c = con.cursor()
c.execute("""select phrase,user_freq
    from py_phrase
    where user_freq = 1
    """)
 
rows = c.fetchall()
f = open('one','w')
for record in rows:
    l = u"%s,%s\n" % record
    f.writelines(l.encode("utf-8"))
 
f.close()
con.close()

在网上搜了一下,还真有人写了个导入词库的脚本:http://forum.ubuntu.org.cn/viewtopic.php?f=8&t=188685

帖子的说明还算详细的,我从sogou细胞词库下载了“成语词条”,稍做修改导入成功后试了下,不错。

文章分类 Unix/Linux 标签: , , ,
One comment on “关于ibus输入法词库
  1. DY Feng说道:

    ibus?还没用过

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*