HtmlParser应用范例
/** *包名:wenc.htmlparser<br> *文件:Test.java<br> *作者:wenc<br> *时间:2007–8–2下午04:03:22<br> *@version1.0 */ package wenc.htmlparser; import java.io.BufferedReader; import java.io.File; import java.io.FileInputS...阅读全文
/** *包名:wenc.htmlparser<br> *文件:Test.java<br> *作者:wenc<br> *时间:2007–8–2下午04:03:22<br> *@version1.0 */ package wenc.htmlparser; import java.io.BufferedReader; import java.io.File; import java.io.FileInputS...阅读全文
A. 索引 Lucene索引可能由多个子索引组成,这些子索引成为段。每一段都是完整独立的索引,能被搜索。索引是这样作成的: 1. 为新加入的文档创建新段。 2. 合并已经存在的段。 搜索时需要涉及到多个段和/或者多个索引,每一个索引又可能由一些段组成。 为了使得基于项...阅读全文
lucene的组成结构:对于外部应用来说索引模块(index)和检索模块(search)是主要的外部应用入口 org.apache.Lucene.search/ 搜索入口 org.apache.Lucene.index/ 索引入口 org.apache.Lucene.analysis/ 语言分析器 org.apache.Lucene.queryParser/ 查询分析器 org.apache.Lucene.document/ 存...阅读全文
I. 简化的查询分析器 目前LUCENE支持的语法: A. 布尔操作符包括AND, OR, NOT, 加(+), 减(-); OR: 如果你要搜索含有字符 A 或者 B 的文档,那么就需要使用 OR 操作符。需要记住的是,如果你只是简单的用...阅读全文
(一) 备份代码,以DbUnit2.2版本为例; //获的connection的一个数据库连接 Connection jdbcConnection = WebDb.getConnect(); //oracle中必须指定Schema,见参数“ZFCG” IDatabaseConnection connection = &nb...阅读全文
IDatabaseConnection dbUnit持有的对数据库的连接。基于jdbc的,以及基于datasource的都有。 IDataSet:表的集合。 FlatXmlDataSet:每个XML元素是对应者一个表行。元素的名字就是表的名字。XML的属性就对应表的列名。如果需要指定为null值,只需要省略对...阅读全文
后来搞清楚JRE是个运行环境,JDK是个开发环境。因此写Java程序的时候需要JDK,而运行Java程序的时候就需要JRE。而JDK里面已经包含了JRE,因此对JAVA_HOME设置为JDK的路径时也可以正常运行Java程序,但是JDK比较大包括了许多与运行无关的内容,因此运行普通的 Java程序无须安装JDK。 但是用了Eclipse又有了疑问,为什...阅读全文
2. 编码基本知识 最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。 2.1. iso8859-1 属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母a的编码为0x61=97。 很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符...阅读全文
一、"@Test"有两个非常有用的参数 A. 异常检测 "@Test"的"expected"参数用来说明希望抛出的异常,如果运行时没有抛出这个异常,测试用例就被标识为失败。 @Test(expected=ArithmeticException.class) p...阅读全文