Monthly Archives: March 2009

袁行远要努力不放弃!

商业实用技术,不过我做的就要做得最好:3月30日,普加搜索自动提示上线。 平均响应时间 多音字 中文拼音混合输入 中文模糊匹配 拼音模糊匹配 英文字母大小混合显示 英文支持 避免首行建议重复 普加 30ms 鉴别 支持 支持 部分支持 支持 支持 支持 Google 50ms 鉴别 不支持 不支持 部分支持 不支持 支持 支持 百度 50ms 鉴别 部分支持 支持 不支持 不支持 支持 支持 优酷 100ms 不支持 支持 … Continue reading

Posted in 未分类 | 3 Comments

Unicode(UTF8)中日韩统一汉字(U+4E00–U+9FBF)判断程序

还是工程应用的文章,utf8 3位汉字编码,至少在中日韩统一汉字中是这样,但怎么判断一个长度为3的string是不是汉字呢?答案一:U+4E00–U+9FBF答案二:访问www.unicode.org答案三:参考这篇文章。答案四:下面这段代码int is_utf8_zh_basic(const char * str){    if (strlen(str)<3) return 0;     /*basic check if str is 1110xxxx 10xxxxxx 10xxxxxx*/    if ((str[0]+256)/16!=14) return 0;    if ((str[1]+256)/64!=2) return 0;    if ((str[2]+256)/64!=2) return 0;     int code=(((str[0]+256)%16)*64*64+((str[1]+256)%64)*64+(str[2]+256)%64);    if ((code>=0x4E00)&&(code<=0x9FbF))  return 1; else return … Continue reading

Posted in 未分类 | 1 Comment

memcached简单的使用教程

这是工程应用性质的文章:memcached是数据快速存取的工具,wikipedia和facebook就用了它提高速度。具体情况可以wiki. c/c++里面使用memcached本来是很简单的事情,但就是没有人说,非要我去读libmemcache的实例代码才行,manpage也没有说清楚(但还不得不看)。如果要使用memcached,步骤如下: 1 安装memcached  你可以去官网上下载,也可以sudo apt-get install memcached2 测试你刚才的安装,  比如运行 memcached -d -m 64 -l 127.0.0.1 -p 12300  -d表示后台, -m 64表示使用64MB内存,-l 127.0.0.1 -p 12300 表示监听127.0.0.1:12300端口  没有任何消息就是运行成功3 安装libmemcached  这个就不要apt了,因为没有精确的libmemcached包,乖乖去官网下载吧。这个东西还需要libevent,这个没法apt,libevent安装的时候最好装到/usr/lib里面,不然libmemcached还不能运行。4 测试libmemcached  找一个文件比如test,然后运行memcp test –servers=127.0.0.1:12300  这样就把test拷贝到memcached管理的内存里面了。  memcat test –servers=127.0.0.1:12300  看看是不是刚才的那个文件。 该装的全装了,我们可以改代码了。 (以下引自:wikipedia) 将纯粹使用数据库查询的程式码加上memcached支援是很简单的,假设这是原来的程式码: function get_foo (int userid) { result = db_select("SELECT * … Continue reading

Posted in 未分类 | Leave a comment