以前用过python爬虫,现在觉得java做起来好像也挺容易的,就自己尝试一下,遇到了一下问题,大多都解决了

总结如下:

1.idea导入jar包的方法:

  1. 不通过拖拽的方式
    1. 按Ctrl+Alt+Shift+S进入Project Structure
    2. 找到Modules->Dependencies
    3. 点击绿色的+添加jar包
  2. 通过拖拽的方式
    1. 把jar包拖入项目
    2. 右键jar包->add as Library

2.正则匹配前后满足条件的String

  1. 不匹配前后
    1. 前:(?<=pattern)
    2. 后:(?=pattern)
  2. 匹配前后
    1. (?:pattern)

3.全局匹配

    while(m.find()){
        system.out.println(m.group(0));//group(0)是总,group(1)-group(n)是分;groupcount()返回匹配的个数,即n的值
    }

4.非贪婪匹配 1.默认贪婪匹配,但*,+后加上?,就为非贪婪匹配;