【推荐】文本分类之TextCNN

从现在开始,我将开始新的篇章,重新了解一遍文本分类的相关任务。这里我从新闻分类入手,进行实验,本文首先介绍一下TextCNN。

最新发布

Python之日志处理(logging模块)
python

Python之日志处理(logging模块)

7937 0

日志是一种可以追踪某些软件运行时所发生事件的方法。软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情。

自然语言处理中的N-Gram模型
NLP

自然语言处理中的N-Gram模型

583 0

N-Gram是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为N的滑动窗口操作,形成了长度是N的字节片段序列。

BeautifulSoup使用总结
python

BeautifulSoup使用总结

62 0

BS是爬虫必学的技能。最主要的功能是从网页抓取数据,Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。

python爬虫与反爬虫
python

python爬虫与反爬虫

630 0

一般网站从三个方面反爬虫:用户请求的Headers,用户行为,网站目录和数据加载方式。前两种比较容易遇到,大多数网站都从这些角度来反爬虫,另外还有ajax加载。