富文本中提取文本的方法分享(富文本导出word)

  本篇文章为你整理了富文本中提取文本的方法分享(富文本导出word)的详细内容,包含有富文本中提取文本的方法分享怎么写 富文本导出word 富文本导出word 富文本处理 富文本中提取文本的方法分享,希望能帮助你了解 富文本中提取文本的方法分享。

  转自:

  http://www.java265.com/JavaJingYan/202205/16534860003509.html

  下文笔者讲述从java代码从富文本html中提取文本内容的方法分享,如下所示
今天接到一个需求,将富文本的内容提取并作为消息转发,那么如何提取其中的富文本呢?下文笔者将一一道来,如下所示

  

实现思路:

 

   只需定义相应的正则表达式

   如:提取文本,只需下列的正则表达式

   String regx = "( .+? )( /.+?

  

 

  

private static Pattern p_image= Pattern.compile(" img.*src\\s*=\\s*(.*?)[^ ]*? ",Pattern.CASE_INSENSITIVE);

 

  private static Pattern r_image=Pattern.compile("src\\s*=\\s*\"?(.*?)(\" \\s+)");

  * 提取富文本中纯文本

  public static String getText(String richText) {

  String regx = "( .+? )( /.+? )";

  Matcher matcher = Pattern.compile(regx).matcher(richText);

  while (matcher.find()) {

   // 替换图片

   richText = matcher.replaceAll("").replace(" ", "");

  return richText;

  * 提取富文本中图片地址

  public static List String getImgStr(String richText) {

  List String list = new ArrayList ();

  Matcher pMatcher = pImage.matcher(richText);

  while (pMatcher.find()) {

   // 得到 img / 数据

   String img = pMatcher.group();

   // 匹配 img 中的src数据

   Matcher rMatcher = rImage.matcher(img);

   while (rMatcher.find()) {

   list.add(rMatcher.group(1));

  return list;

  }

 

  


private static Pattern p_image= Pattern.compile(" img.*src\\s*=\\s*(.*?)[^ ]*? ",Pattern.CASE_INSENSITIVE);

 

  private static Pattern r_image=Pattern.compile("src\\s*=\\s*\"?(.*?)(\" \\s+)");

  * 提取富文本中纯文本

  public static String getText(String richText) {

  String regx = "( .+? )( /.+? )";

  Matcher matcher = Pattern.compile(regx).matcher(richText);

  while (matcher.find()) {

   // 替换图片

   richText = matcher.replaceAll("").replace(" ", "");

  return richText;

  * 提取富文本中图片地址

  public static List String getImgStr(String richText) {

  List String list = new ArrayList ();

  Matcher pMatcher = pImage.matcher(richText);

  while (pMatcher.find()) {

   // 得到 img / 数据

   String img = pMatcher.group();

   // 匹配 img 中的src数据

   Matcher rMatcher = rImage.matcher(img);

   while (rMatcher.find()) {

   list.add(rMatcher.group(1));

  return list;

  }

 

  

  以上就是富文本中提取文本的方法分享(富文本导出word)的详细内容,想要了解更多 富文本中提取文本的方法分享的内容,请持续关注盛行IT软件开发工作室。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: