Hello world!

Welcome to WordPress.com. This is your first post. Edit or delete it and start blogging!

Advertisements
Posted in 未分类 | Leave a comment

54054.com 二重高中2005级四班班级网站恢复运行

http://www.54054.com/ 欢迎您的访问!

1 我们已经恢复04年之后95%的论坛帖子
2 我们恢复了所有的站内信http://www.54054.com/bbs/pm.php
3 所有用户均可使用之前的用户名登录,默认密码为123456,修改密码访问: http://www.54054.com/bbs/memcp.php?action=profile&typeid=1

重拾心灵归宿,共建网上家园。大家一起加油吧!

Posted in 未分类 | 1 Comment

新生活,新气象!

昨天,当我把水杯放下,我知道,无论我多么不舍,我都必须离开了。

青岛,红瓦绿树,碧海蓝天。科大,宏伟的校园,孤傲的宋院士,恶心的团委和评估。普加,有激情与梦想,也有资本与工程的无奈。

如果我所需小到一杯水都要再三请求才能得到,有时甚至得不到,我还有什么好留恋的呢?

我喜欢北京地铁的快捷,尽管拥挤。我喜欢古城的文化和798的张扬,文艺青年聚集地。我也喜欢TB级别的数据,对算法的认真研究,朴素的生活。

感谢普加指导我步入社会第一步,感谢淘宝给了我价值的承认。希望我不要忘记对人工智能的理想。

新生活,新气象!

Posted in 未分类 | 2 Comments

Network Sea of Dream 神经网络计算框架(包含旋律识别) 开放源代码

svn 地址: http://svn.recognic.info/svnroot/recognic/previousWork/nsod

NsodNetwork.c核心代码:http://recognic.svn.sf.net/viewvc/recognic/previousWork/nsod/network_processor/NsodNetwork.c?view=markup

没有好的文档说明,作为补偿,我在电邮地址ChaosConst[at]gmail[dot]com尽力为有意看看旋律识别代码的人解惑。

Posted in 未分类 | 10 Comments

utf8文件繁简混合转简体解决方案

扫描某文件的时候需要处理繁简转换,一个繁简混合的文件全部转成简体,在网上查了一圈都失败了,结果把本机上的mediawiki里面的一个文件打开一看:得来全不费功夫。
/usr/share/mediawiki/includes/ZhConversion.php
Posted in 实用技术 | 1 Comment

袁行远要努力不放弃!

商业实用技术,不过我做的就要做得最好:3月30日,普加搜索自动提示上线。

平均响应时间

多音字

中文拼音混合输入

中文模糊匹配

拼音模糊匹配

英文字母大小混合显示

英文支持

避免首行建议重复

普加

30ms

鉴别

支持

支持

部分支持

支持

支持

支持

Google

50ms

鉴别

不支持

不支持

部分支持

不支持

支持

支持

百度

50ms

鉴别

部分支持

支持

不支持

不支持

支持

支持

优酷

100ms

不支持

支持

支持

不支持

不支持

支持

不支持

口碑

100ms

鉴别

不支持

不支持

不支持

不支持

不支持

不支持

豆瓣

50ms

兼容

不支持

不支持

部分支持

重复显示

支持

支持

爱帮

50ms

兼容

不支持

不支持

不支持

支持

支持

支持

以上统计自2009年3月30日。

Posted in 未分类 | 3 Comments

Unicode(UTF8)中日韩统一汉字(U+4E00–U+9FBF)判断程序

还是工程应用的文章,utf8 3位汉字编码,至少在中日韩统一汉字中是这样,但怎么判断一个长度为3的string是不是汉字呢?
答案一:U+4E00–U+9FBF
答案二:访问www.unicode.org
答案三:参考这篇文章
答案四:下面这段代码
int is_utf8_zh_basic(const char * str)
{
    if (strlen(str)<3) return 0;

    /*basic check if str is 1110xxxx 10xxxxxx 10xxxxxx*/
    if ((str[0]+256)/16!=14) return 0;
    if ((str[1]+256)/64!=2) return 0;
    if ((str[2]+256)/64!=2) return 0;

    int code=(((str[0]+256)%16)*64*64+((str[1]+256)%64)*64+(str[2]+256)%64);
    if ((code>=0x4E00)&&(code<=0x9FbF))  return 1; else return 0;
}
统计扫描百兆以上级数据时常常遇到匪夷所思的字符,用这个过滤一下吧。

Posted in 未分类 | 1 Comment