Projects tagged ‘chinese’


[351 total ]

1 Users

Eclectus is a small Han character dictionary especially designed for learners of Chinese character based languages like Mandarin Chinese or Japanese.
Created 3 months ago.

0 Users

基于python的中文分词项目。 ... [More] 第一个版本实现了基于的MMSEG中文分词算法Python实现。MMSEG实际上是一个正向最大匹配+多个规则的分词算法。链接给出的几个网站写的很清楚了。在开发过程中我增加了一个规则来处理原来的算法中有可能出现的冲突问题。当所有的规则都无法唯一的确定一个chunk时,优先选择后面比较长的词。开发过程中参照了MMSEG的Java实现和ruby实现。并且对性能进行了初步的优化。 目前的性能数据:在Pentium D 2.8G的CPU下处理2.9MB的文本数据,全切分的复杂算法不开启pysco的情况下104s,开启pysco的情况下90s,能达到32KB/s。简单算法可以达到64KB/s。经测试速度能达到Java版本MMSEG的1/3,未来如果要进一步优化速度的话应该是把关键的算法的实现移植到c语言中。 实现了简单的余弦相似度计算的算法。 TODO: 实现NLTK兼容的接口。(目前已经增加了tokenizer接口) C语言级别的优化 (测试中,增加了is_basic_latin的c实现,考虑字典用c语言优化) 实现其他算法,目前考虑一个ICTCLAS的python实现,要看有没有时间。 支持停用词,支持unicode的字母数字检测等。 与分词有关的其他想法 研究一下ferret/cferret,能否实现一个python binding并且结合进去。(研究发现ferret的实现非常复杂,ruby绑定的接口部分的c代码都有上万行,放弃了,还是用solr吧) 与nlp/datamining的进一步结合 [Less]
Created about 1 year ago.

0 Users

Open Book Project 开放图书计划 -- 聚集中文Pythonic技术图书 发起人 ZoomQuiet O.B.P 邮件列表 技术图书创作自由讨论列表 zeuux-python 邮件列表 <> ... [More] 读者沟通专用 图书勘误 :用 code.google 的 使用Issues服务进行提案收集 工程维基 -- 啄木鸟社区维基 修订追踪: Issue -- UsageIssue 快速使用Issue教程 Issue(提案)使用流程 -- IssueFlow ~ Issue流程概述 Issue(提案)标签约定 -- IssueTags ~ Issue标签详解 进度协调: IRC -- UsageIrc 快速使用IRC ObpMember ~ 工程成员情况 TechnoDict -- 技术词典 工程索引:: O.B.P 图书项目{DONE!}Lovely PythonPython 源码剖析Python核心编程2ed{Doing...}web2py手册TPiP{enjoy...}PyWDWWdocs.py_zhthinkPP2.0_zh{stop}Lovely KarrigellLearnning PythonBeginning Python图书经验 O.B.P 图书项目{DONE!}Lovely PythonZoomQuiet ~ 发起的原创图书: LovelyPython--初学者极速入门故事 售后活动:: 哲思社区 - 活动 - 何艳 - 浏览活动 - 《可爱的Python》读者见面会 闲话"可爱的Python"090913 互动9周年庆的现场幻灯讲演 工程组织:: 可爱的Python 冲击前进!成书进度汇总081214 完成!进入排版 ZeuuxTechReview ~ 哲思技术校对团队080917进驻 source:LovelyPython / LovelyPyDirs ~ 目录约定 Python 源码剖析CPyUG+ZEUUX 作为技术校对 进度: PySourceReading ~ 技术校对进度 2008-04-01 完成校对! ZeuuxMember ~ 技校军团简介 Python核心编程2edCPyUG 组织团队翻译完成 source:CorePy_zh 维基:Python 核心编程 工程约定: CorePyZh ; 工程进度讨论记要 # CorePython_zh ::工程进度 2007-12-07 finished! ~ CorePyZhPeople - 参与行者自述 {Doing...}web2py手册web2py手册2ed中文版 TPiP深入Python 文本处理 {enjoy...}没有出版社合同的自主图书计划 PyWDWW发起:OBP建议:蟒样Web开发 - python-cnCPyUG华蟒用户组(中文Py用户组) | Google Groups 工程入口 docs.py_zhPython 官方文档中文计划筹备ing... 团队:刘鑫 , 尹伟铭 , Kernel1983 , ZoomQuiet DocsPyZhMember ~ 成员 SVN: v2.6.1 http://openbookproject.googlecode.com/svn/trunk/docs.py_zh/v2.6.1 v3.0 http://openbookproject.googlecode.com/svn/trunk/docs.py_zh/v3.0 编译:reST文档整站编译方法 thinkPPHow to Think Like a (Python) Programmer 如何象程序员般思考~Py版中文翻译计划 PyStLib 2.0_zhPython 标准库 中文翻译 进度: PyStLib翻译改进汇总进度 {stop}Lovely Karrigell作为可爱的Python 的补充附文 LovelyKarrigell--体验Karrigell 的自在Web开发 source:LovelyKarrigell Learnning Python机械-华章分社 提议,沟通末果,中止 3ed 版本的中文翻译... Beginning Python进度: BeginningPython ~ 技术校对进度汇总 图书经验HowToBuildBookOnline ~ 如何组织在线图书工程 [Less]
Created about 1 year ago.

0 Users

My work for E-bussines on the UJ university.
Created 9 months ago.

0 Users

ChatZilla 是什么?ChatZilla是一个基于Mozilla网络浏览器的IRC客户端软件,它是由XUL和JavaScript语言编写的。 ... [More] ChatZilla程序本身十分轻巧,同时由于它是基于Mozilla网络浏览器,所以ChatZilla是跨平台的,可以支持多操作系统下的使用。ChatZilla支持大部IRC客户端软件的特性,如可以同时连接多个IRC服务器,支持UTF-8等等。ChatZilla支持JavaScript作为脚本语言。 ChatZilla可以作为Firefox,Mozilla,SeaMonkey网络浏览器的插件使用。 下载安装 ChatZilla ChatZilla 简体中文语言包本语言包为 ChatZilla 提供简体语言环境支持。 下载安装(@Mozilla Addons) 由于是新上传的扩展,需要经过试验阶段才能公开下载。 现在需要积累下载数和评分,所以下载需要登录。下载后记得给我们评评分啊! 如果发现翻译有误或有异议,请到 Issues 中提交给我们。 [Less]
Created 12 months ago.

0 Users

ChineseSegment
Created 9 months ago.

0 Users

中国幼儿、儿童教育资源共享
Created 11 months ago.

0 Users

Author create a novel, and call reader or some guys to finish the novel.
Created 7 months ago.

0 Users

相关文档
Created 11 months ago.