詳解正則表達式Matcher類中group方法

 更新時間:2019年08月20日 11:33:41   作者:家里那只橘貓   我要評論
這篇文章主要介紹了正則表達式Matcher類中group方法,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下

前言

同事把一個excel表給我,里面的數據大概有幾千的樣子吧。自己需要把里面的數據一個一個拿出來做一個http請求,對得到的結果進行過濾,然后再寫到上面去。這是就涉及到用腳本來進行操作了,于是自己搞了一個Java的腳本出來,里面涉及到一些正則表達式,自己雖然說會,但是一直對 Matcher類中的group方法 不太了解。網上的博客也沒有寫的特別清楚,于是有了此文。

0|1Pattern 和 Matcher

在java.util.regex 包下

  1. Pattern(模式類) : 用來表達和陳述所要搜索模式的對象。Pattern.compile(pattern) pattern 也就是你寫的正則表達式
  2. Matcher(匹配器類):真正影響搜索的對象。上面Pattern.compile(pattern)得到一個Pattern對象 為 r。 r.matcher(line) line也即是你需要進行匹配的字符串 。這樣會得到一個 Matcher 的對象。
  3. PatternSyntaxException: 當遇到不合法的搜索模式時,會拋出例外。

0|1正則表達式語法

在有的語言中,一個反斜杠 \ 就足以具有轉義的作用,但是Java中需要兩個 \\ 反斜杠。表示轉義的作用。一些字符在正則表達式中的說明,意義。詳情可查看runoob

0|1上代碼

現在我的正則表達式為 (//d+)([a-z]+)(//d+)

  1. //d+ 表示最少匹配一個數字
  2. [a-z]+ 表示最少匹配一個字符
  3. 需要指定的字符串為 "123ra9040 123123aj234 adf12322ad 222jsk22"
  4. 代碼如下 :
public static void main( String args[] ){
    // 按指定模式在字符串查找
    String line = "123ra9040 123123aj234 adf12322ad 222jsk22";
    String pattern = "(\\d+)([a-z]+)(\\d+)";
//    String pattern1 = "([\\u4E00-\\u9FA5]+|\\w+)";
    // 創建 Pattern 對象
    Pattern r = Pattern.compile(pattern);
    // 現在創建 matcher 對象
    Matcher m = r.matcher(line);
    int i = 0;
    // m.find 是否找到正則表達式中符合條件的字符串
    while (m.find( )) {
      // 拿到上面匹配到的數據
      System.out.println("----i="+i);
      System.out.println("Found value: " + m.group(0) );
      System.out.println("Found value: " + m.group(1) );
      System.out.println("Found value: " + m.group(2) );
      System.out.println("Found value: " + m.group(3) );
      i++;
      System.out.println("|||||||");
      System.out.println("");
    }
  }

輸出:

----i=0
Found value: 123ra9040
Found value: 123
Found value: ra
Found value: 9040
|||||||
----i=1
Found value: 123123aj234
Found value: 123123
Found value: aj
Found value: 234
|||||||
----i=2
Found value: 222jsk22
Found value: 222
Found value: jsk
Found value: 22
|||||||

group(0) 對應著 ((//d+)([a-z]+)(//d+)) 123ra9040

group(2) 輸出的數據 是 group(0)中所匹配的數據 也就是([a-z]+) 匹配到是數據 ra

group(3) 輸出的數據 是 group(0)中所匹配的數據 也就是(//d+) 匹配到是數據 9040

0|1總結

Matcher 類中group(0) 表示正則表達式中符合條件的字符串。

Matcher 類中 group(1) 表示正則表達式中符合條件的字符串中的第一個() 中的字符串。

Matcher 類中 group(2) 表示正則表達式中符合條件的字符串中的第二個() 中的字符串。

Matcher 類中 group(3) 表示正則表達式中符合條件的字符串中的第三個() 中的字符串。

如果不明白,我相信看代碼會很明白的。

總結

以上所述是小編給大家介紹的正則表達式Matcher類中group方法,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時回復大家的!

相關文章

最新評論

北京pk赛车人工计划软件手机版