推荐先阅读
:JavaSE
https://www.runoob.com/regexp/regexp-syntax.html
字符类 [abc] a、b 或 c(简单类) [^abc] 任何字符,除了 a、b 或 c(否定) [a-zA-Z] a 到 z 或 A 到 Z,两头的字母包括在内(范围) [a-d[m-p]] a 到 d 或 m 到 p:[a-dm-p](并集) [a-z&&[def23]] d、e 或 f(交集) [a-z&&[^bc]] a 到 z,除了 b 和 c:[ad-z](减去) [a-z&&[^m-p]] a 到 z,而非 m 到 p:[a-lq-z](减去) 预定义字符类 . 任何字符 \d 数字:[0 -9 ] \D 非数字: [^0 -9 ] \s 空白字符:[ \t\n\x0B\f\r] \S 非空白字符:[^\s] \w 单词字符:[a-zA-Z_0-9 ] \W 非单词字符:[^\w] 以上正则匹配只能校验单个字符。 Greedy 数量词 X? X,一次或一次也没有 X* X,零次或多次 X+ X,一次或多次 X{n} X,恰好 n 次 X{n,} X,至少 n 次 X{n,m} X,至少 n 次,但是不超过 m 次
public String[] split(String regex);public String replaceAll (String regex,String newStr) ;
正则表达式爬取信息中的内容 。
public class RegexDemo05 { public static void main (String[] args) { String rs = "来黑马程序学习java,电话020-43422424,或者联系邮箱" + "itcast@itcast.cn,电话18762832633,0203232323" + "邮箱bozai@itcast.cn,400-100-3233 ,4001003232" ; String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|(1[3-9]\\d{9})|(0\\d{2,5}-?\\d{5,15})|400-?\\d{3,8}-?\\d{3,8}" ; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(rs); while (matcher.find()){ System.out.println(matcher.group()); } } }