普通网友 2021-07-08 22:33 采纳率: 12.5%
浏览 31

请问如何python从一段文字或一张图片中识别出里面提到的所有股票名?

比如随便一段文字

受电动汽车发展拉动、相关材料价格上涨影响,锂电、锂矿、电解液板块同时大涨。

截至7月2日收盘,Wind锂电池指数上涨1.74%。该指数下南都电源(300068.SZ)上涨17.13%,报收11.9元;嘉元科技(688388.SH)上涨10.85%,报收100.1元;超华科技(002288.SZ)涨停;诺德股份(600110.SH)上涨9.66%。

同日,WIND锂矿指数大涨3.55%。截至收盘,中矿资源(002738.SZ)涨停,永兴材料(002756.SZ)盘中一度涨停,最终收涨8.72%;天齐锂业(002466.SZ)、盛新锂能(002240.SZ)等跟涨,涨幅分别达4.39%和2.99%。

电解液板块同样表现强势。多氟多(002407.SZ)盘中最高涨幅达到9.57%逼近涨停,最终收于37.5,上涨6.78%;奥克股份(300082.SZ)、天际股份(002759.SZ)涨幅分别超4%和3%。

这最重要影响因素为相关材料价格出现上扬。

【新能源汽车产业链锂电池各类细分个股】

1.电池:宁德时代、比亚迪、亿纬锂能、国轩高科、鹏辉能源、川能动力、欣旺达。

2.正极材料:a.三元正极:容百科技、当升科技、杉杉能源(杉杉股份 )、格林美、中伟股份、厦钨新能(厦门钨业 )。b.磷酸铁锂正极:德方纳米。c.钴酸锂和锰酸锂正极:湘潭电化。

3.隔膜:恩捷股份。

4.电解液:天赐材料、天际股份、新宙邦、杉杉能源。

5.负极材料:璞泰来、中科电气、杉杉能源、翔丰华。

6.导电剂:天奈科技。

7.锂电设备:先导智能、杭可科技。

8.锂资源:赣锋锂业、天齐锂业、永兴材料。

9.钴资源:华友钴业、寒锐钴业、洛阳钼业。

10.镍资源:格林美、华友钴业、盛屯矿业。

11.铜箔:超华科技、诺德股份、嘉元科技。

12.结构件:科达利。

主要问题

1 股票名有一个数据库 包括曾用名 这个很多财经网站或数据库如tushare上都有数据列表

2 有的股票是三个字 有的是四个字

3 有的股票还有st 等等前缀

4 带股票代码的比较好识别 没有代码的靠文字来识别

5 能识别错别字就最好了 因为很多人打字股票名 容易出错 但都知道他说的是啥股票

6 一堆文字中实现了 再加上图片文字识别 就可以识别图片里的股票名了 需要python工具包来完成

  • 写回答

1条回答 默认 最新

  • Feng-licong 2021-07-08 23:50
    关注

    可以先把所有的股票名写成词典,然后用jieba库进行分词。

    评论

报告相同问题?

问题事件

  • 创建了问题 7月8日

悬赏问题

  • ¥50 永磁型步进电机PID算法
  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥200 uniapp长期运行卡死问题解决
  • ¥15 latex怎么处理论文引理引用参考文献
  • ¥15 请教:如何用postman调用本地虚拟机区块链接上的合约?
  • ¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题:[h264 @ 000000004faf7500]no frame?