iPie

思维碎片 | 一艺之成 当尽毕生之力
    <<  挫败感 | 首页 | Java字符串split方法的小陷阱  >>
  • 中文分词与词性标注测评程序

    2009-07-21 00:53:03 by deepblue

    前几天为了测试中文分词和词性标注程序的效果,写了一个简单的测试程序,用于测试分词和词性标注结果的precision,recall和F-score。下面是测试输出:

    --------------Evaluation Result-------------

    Word Count Standard: 69953, Word Count Test: 69231, Correct Segmented: 67212
    P-Word=0.9708367638774538
    R-Word=0.9608165482538276
    F-Word=0.9658006667433038

    POS Count Standard: 69953, POS Count Test: 69231, Correct Segmented: 64159
    P-POS=0.9267380219843712
    R-POS=0.9171729589867482
    F-POS=0.9219306816875502

    测试程序附在此,需要的朋友可以直接用: 中文分词与词性标注测试程序

     


    随机文章:

    Java字符串split方法的小陷阱 2009-07-29
    译书已出版 2009-02-13
    NekoHtml与XPath 2008-11-25
    Eclipse 添加javadoc和source 2008-05-24
    不用临时变量,交换两个数的值 2009-04-19

    收藏到:Del.icio.us




    引用地址:
    编辑 | 继续话题 | 转发 | 分享 0 | 分类:Java | Tag:programming Java

搜索

最新日志

  • Java字符串split方法的小陷阱
  • 中文分词与词性标注测评程序
  • 挫败感
  • Google Developer Day 2009
  • 近日流水帐
  • 不用临时变量,交换两个数的值
  • Catalan数
  • 工作到现在
  • 后台无界面启动VMWare中的虚拟系统
  • Linux高级权限管理:ACL用法简介
全部日志>>

文章分类

  • 生活[30]
  • 分享[16]
  • 学习[1]
  • 技术[8]
  • 互联网[20]
  • Amazing[3]
  • Python[11]
  • Java[8]
  • 杂[10]

友情链接

  • Doris : My Special One
  • Flyfeeling : 小王博士
  • Skivet’s blog:老同桌
  • Open Source Living:开源盛典
  • winAddons:新软推荐
  • 大师之路:PS充电

存档

  • 2009-07[2]
  • 2009-06[3]
  • 2009-04[2]
  • 2009-03[5]
  • 2009-02[5]
  • 2008 [84]
  • 2007 [5]

订阅

抓虾
google reader
bloglines
鲜果
PageRank:
  • 访问统计:
  • 什么是RSS?
Copyright © 2007-2008 iPie.blogbus.com, All Rights Reserved. iPie 版权所有