我现在做的是一个微博的信息过滤系统的一部分,去除其中的转发(//后的内容)回复(回复@)以及提及(@)举个例子比如说一条信息是:
回复@伯纳乌王子:这比赛还是得看C罗!@一生只爱伯纳乌 [开心]//@红蓝英雄 今天打的不错!赞一个[开心]
处理后显示为:这比赛还是得看C罗![开心]
单个语句的处理我已经实现,代码如下:
public class AnalyseWeibo {
public static void main(String args[]){
String test = "回复@伯纳乌王子:这比赛还是得看C罗!@一生只爱伯纳乌 [开心]//@红蓝英雄 今天打的不错!赞一个[开心]";
String pattern = "\\回复@(.*?)\\:";
String pattern1 = "\\@(.*?)\\ ";
int idx = test.indexOf("//@");
String test1 = test.substring(0, idx);
String test2 = test1.replaceAll(pattern, "");
String test3 = test2.replaceAll(pattern1, "");
System.out.println(test3);
}
}
现在想知道如何从一个txt文件中读取很多这样的语句然后处理后再输入到新的txt文件中!求大神解答!谢谢!