【转】 一个使用WordNet比较词语相似度的Java包——JWS(Java WordNet Similarity)

    技术2022-05-20  48

    JWS是WordNet::Similarity(一个Perl版的WordNet相似度比较包)的Java实现版本,想用Java实现用WordNet比较词语相似度的朋友有福拉!!简述使用步骤:

    1、下载WordNet(Win、2.1版):http://wordnet.princeton.edu/wordnet/download/;

    2、下载WordNet-InfoContent(2.1版):http://wn-similarity.sourceforge.net/ 或 http://www.d.umn.edu/~tpederse/Data/;

    3、下载JWS(现有版本:beta.11.01):http://www.cogs.susx.ac.uk/users/drh21/;

    4、安装WordNet;

    5、解压WordNet-InfoContent-2.1,并将文件夹拷贝至WordNet目录D:/Program Files/WordNet/2.1下;

    6、将JWS中的两个jar包:edu.mit.jwi_2.1.4.jar和edu.sussex.nlp.jws.beta.11.jar拷贝至Java的lib目录下,并设置环境变量;

    7、在Eclipse下运行JWS中的例子程序:TestExamples

         说明:由于下载的WordNet是2.1版本的,所以程序中有几处需要修改

         String dir = "C:/Program Files/WordNet";    //这里指定WordNet的安装路径,按照你实际安装的路径加以修改

         JWS ws = new JWS(dir, "3.0");                   //把3.0改为2.1即可

    8、例子运行结果:

    Loading modulesset up:... finding noun and verb <roots>... calculating IC <roots> ...... ICFinder... DepthFinder... PathFinder... JiangAndConrath... Lin... Resnik... Path... WuAndPalmer... Adapted Lesk : all relations... Adapted Lesk (1)... Adapted Lesk (2)... HirstAndStOnge... LeacockAndChodorow... calculating depths of <roots> ...

    Java WordNet::Similarity using WordNet 2.1 : loaded

    Jiang & Conrath

    apple#n#1,banana#n#1 0.04658846107981151apple#n#1,banana#n#2 0.13115409462626942apple#n#2,banana#n#1 0.0apple#n#2,banana#n#2 0.0

    specific pair = 0.04658846107981151

    highest score = 0.13115409462626942

    Lin

    apple#n#1,banana#n#1 0.11802556069890623apple#n#1,banana#n#2 0.6867056880240358apple#n#2,banana#n#1 0.0apple#n#2,banana#n#2 0.0

    specific pair = 0.11802556069890623

    highest score = 0.6867056880240358

    具体还在学习中,先记录这些,权当笔记了。

    本文来自博客,转载请标明出处:http://blog.csdn.net/chz870128/archive/2011/04/13/6320913.aspx

     


    最新回复(0)