意向书特别
路演特别:
发行公告特别:
中签率公告特别:
网下配售结果公告
中签结果公告
上市公告书
意向书特别:
路演特别:
发行公告特别:
中签率公告特别:
网下配售结果公告
中签结果公告
上市公告书
说明书
1如果元素判断相同自然可以用set,不过这里不适用.
需要匹配关键词的话简单点先合并字符串(不考虑连续字符串各有一部分组成关键词的情况.)
for b in list_b:
for a in list_a:
if a in b:
print(a)
2 如果元素判断相同自然可以用set,不过这里不适用.
需要匹配关键词的话简单点先合并字符串(不考虑连续字符串各有一部分组成关键词的情况.)
res = [i for i in list_a if i in ''.join(list_b)]
3 如果字符串太长或需要语义准确可以先对list_b中的字符串分词, 然后求set的交集或其他处理.
如 ['市长'] 不匹配 ['南京市长江大桥']
import re
res = re.findall('|'.join(list_a), ''.join(list_b))
import requests
from lxml import etree
info_list = [] # 避免问题出来
url = r"http://www.sse.com.cn/disclosure/listedinfo/bulletin/s_docdatesort_desc_2019openpdf.htm"
header = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36",
"Referer": "http://www.sse.com.cn/disclosure/listedinfo/announcement/"
}
response = requests.get(url, headers = header)
response.encoding = "utf-8"
ele_html = etree.HTML(response.text)
info_list = ele_html.xpath('//em/a/text()')
# info_list = ele_html.xpath("//dl/dd/em/a/text()")
print(len(info_list), info_list)
list_a= ["说明书","意向书","路演","发行","中签率","配售","中签","上市"]
list_a1 = ["说明书","意向书"]
for j in range(len(list_a1)):
for i in range(len(info_list)):
if list_a1[j] in info_list[i]:
print(info_list[i])
往往从ERP捞出的资料相对分散,用一下Vlookup-->然后透视表一下-->照相机再拍--->交给画图并红圈标出重点-->邮件发出-->再用Excel记下本次重点-->下个月再一次这样循环。