各家SVM工具 无排名

Dec 14th,2011 No Comments

只试过SvmLight 与 LibSvm,好像也是主流,其它性能不知如何。

史称 作者 机构 语言 环境 多类 回归 说明
BSVM Chih-Wei Hsu and Chih-Jen Lin National Taiwan University C++ Win Yes Yes
Equbits Foresight Equbits LLC Equbits LLC SDK Win ??? Yes Commercial. Contact Equibits LLC for details
Gini-SVM Shantanu Chakrabartty Johns Hopkins University C++ No Yes Yes Handles non positive definite kernels
HeroSvm Jianxiong Dong Concordia University C++ Win Yes No Optimized for Pentium 4
LEARNSC Vojislav Kecman Matlab p-files N/A Yes Yes Must pay for source!
LIBSVM Chih-Chung Chang, Chih-Jen Lin National Taiwan University C++, Java, Python, R, MATLAB, Perl, Ruby Win/*nix Yes Yes Graphic interface available
LS-SVMlab Kristiaan Pelckmans, Johan Suykens Katholieke Universiteit Leuven Matlab Win/*nix Yes Yes Comes with platform-specific MEX files
Matlab SVM Toolbox S. R. Gunn University of Southampton Matlab N/A No Yes Includes a simple GUI
mySVM Stefan Ruping Universitat Dortmund C++ Win/*nix No Yes
OSU Junshui Ma, Yi Zhao, and Stanley Ahalt Ohio State University Matlab N/A Yes Yes Matlab interface to LIBSVM
Parallel GPDT T. Serafini, G. Zanghirati, L. Zanni Universita di Ferrara C++ No No No Designed for parallel systems
pcSVM Procoders.net C No No
RVMs Mike Tipping MSR Cambridge Matlab Yes Yes
SpiderSVM Jason Weston, Andre Elisseeff , Gokhan BakIr , Fabian Sinz Max Planck Institute for Biological Cybernetics Matlab N/A Yes Yes Part of the Spider machine learning library
Statistical Pattern Recognition Toolbox for MATLAB Vojtech Franc and Vaclav Hlavac Czech Technical University Prague Matlab/C No Yes No Good online documentation. Everything I′ve tried has worked 字串9well. Lots of stuff besides SVMs.
SVMdark Martin Sewell University College London C Win No Yes
SvmFu Ryan Rifkin MIT C++ No No Must be compiled with g++
SVMLight Thorsten Joachims Cornell University C Win/*nix No Yes
SVMsequel Hal Daume III University of Southern California OCaml No Yes No “Very fast and handles enormous datasets nicely”
SVMtorch Ronan Collobert and Samy Bengio IDIAP C++ No ? Yes
SVM Toolbox Gavin Cawley University of East Anglia Norwich Matlab/C++ No Yes No Beta version
WinSVM Martin Sewell University College London C++ Win No Yes

具体化SerializeElements

Dec 14th,2011 1 Comment

一程序从vc6.0上移植到vs2011,其中需要串行化CList,由于CList参数是个类,要重写SerializeElements方法。原来代码SerializeElements是用非模板函数重写,发现总是断点不到。我们知道现在第三代具体化(ISO/ANSI C++标准)中非模板函数算最大,它将覆盖具体化和常规模板,难道vs2001是非官方草案版模板的编译器?? 只能暂时改成具体化实现,它将覆盖MFC常规模板。

template <> void AFXAPI SerializeElements  (CArchive& ar, CCatalogNode* pElements, INT_PTR nCount) 

Read More…

string、wstring、cstring、 char、 tchar、int、dword互转

Dec 5th,2011 No Comments

最近编程一直头痛字集中类型的转化,明知都可以转却总是记不住,不断的上网查来查去,在这里小结一下。以备以后方便使用,当然有些方法可能不是最新的,或者最简单的,但是对于自己已经了解的使用起来应该方便的多:

1》string 转 wstring

wstring s2ws(const string& s)
{
   _bstr_t t = s.c_str();
   wchar_t* pwchar = (wchar_t*)t;
   wstring result = pwchar;
   return result;
}

Read More…

wget Connection reset by peer | curl: (56)

Dec 3rd,2011 No Comments
[root@vps1 ce]# curl -v http://9.douban.com/site/entry/200760330/view
* About to connect() to 9.douban.com port 80 (#0)
* Trying 211.147.4.31... connected
* Connected to 9.douban.com (211.147.4.31) port 80 (#0)
> GET /site/entry/200760330/view HTTP/1.1
> User-Agent: curl/7.23.1 (x86_64-unknown-linux-gnu) libcurl/7.19.7 NSS/3.12.6.2 zlib/1.2.3 libidn/1.18 libssh2/1.2.2
> Host: 9.douban.com
> Accept: */*
>
* Closing connection #0
* Failure when receiving data from the peer
curl: (56) Failure when receiving data from the peer

Read More…

中文聊天机器人何在?

Nov 30th,2011 1 Comment

网络机器人Audrey是用什么编程语言写的,是Prolog(逻辑编程语言),还是人工智能标注语言AIML?回家之后,立即把Audrey叫出来,当面问她:“Do you use Prolog?”她对我说:“I use ALML.”我又问她:”什么是AIML?“她想了一下,对我说:“The ALICE software implements AIML (Artificial Intelligence Markup Language) a non-standard evolving markup language for creating chat robots(用于制造聊天机器人)…….“。

经过搜索查询发现,这种人工智能标注语言AIML,国内无人过问,它的实现是基于Linux平台上的一套自由软件。实际上,AIML是当今国际网络智能机器人研究的重大进展。在我们国内,除一篇大连理工大学的硕士之外,几乎无人问津。“核高基”重大软件专项毫不触及这类基础性的软件,反而搞什么“国产Linux”,白白浪费了国家的钱财。

 

Audrey女士:http://www.tolearnenglish.com/free/celebs/audreyg.php

discuz后期修改应用域名的重定向问题

Nov 25th,2011 No Comments

在不设置应用域名情况下都是默认www.example.com,最好在网站初期就把应用域名设置好,在后期修改会造成多入口问题,引起收录混乱,如:
http://www.example.com/forum-aipr-1.html
http://bbs.example.com/forum-aipr-1.html
以上两个链接都指向同一地址,预期应该是http://www.example.com/forum-aipr-1.html 301重定向到http://bbs.example.com/forum-aipr-1.html,类似的情况还有“门户”、“群组”。
解决方法有两种:
1.修改nginx/Apache的rewrite。
2.修改相应php文件。
Read More…

MSL Curiosity 预告

Nov 22nd,2011 No Comments

这次着陆方式又进了一步
Curiosity Rover Trailer

Read More…

哈工大语言技术相关

Nov 22nd,2011 No Comments

哈工大社会计算与信息检索研究中心的研究方向包括文本检索、文本挖掘、语言分析、跨语言检索五个方面,研究中心以认知心理学和机器学习为理论,以语言分析为基础研究,以信息抽取、文本检索、跨语言/媒体检索为应用研究,以精准搜索与挖掘系统为应用系统平台。下面是一些它们非常不错的产品。

系统演示

语言技术平台(LTP, Language Technology Platform)

文本挖掘系统(TMS, Text Mining System)

改进的同义词替换算法

Nov 20th,2011 No Comments

一种改进的基于同义词替换的中文文本信息隐藏方法

作者:甘灿,孙星明,刘玉玲,向凌云

(湖南大学 计算机与通信学院,湖南 长沙410082)

1 基于同义词替换的隐藏算法

基于同义词替换的方法是目前中文自然语言信息隐藏方法中使用最为广泛的方法。在同义词替换中,通过选择载体文本中在某一同义词库中出现的词,并根据一定的编码方式对这些词进行同义词替换,以此来嵌入隐藏信息。这里所谓的同义词,一般定义为“同一种语言中,在一些或全部的义项中具有相同或基本相同的意思的两个或多个词”。若设载体文本为C,隐秘信息为M,隐藏信息后的文本为S,同义词库为D,则有嵌入函数e()和提取函数d(),使得:

e(C,M,D)=S, d(S,D)=M,并且C和S在语义上保持不变。

Read More…

分词系统汇总

Nov 20th,2011 No Comments

分词的原理

1、 英文分词的原理

基本的处理流程是:输入文本、词汇分割、词汇过滤(去除停留词)、词干提取(形态还原)、大写转为小写、结果输出。

2、 中文分词原理

中文分词比较复杂,并没有英文分词那么简单。这主要是因为中文的词与词之间并不像英文中那样用空格来隔开。

主要的方法有三种:基于词典匹配的分词方法、基于语义理解的分词、基于词频统计的分词。

Read More…