如何使用Python创建词云？

资讯 4年前

1.61K

词云是什么？如何使用Python创建词云？

介绍从开始从事数据可视化工作的那一天起，我就爱上它了，我总是喜欢从数据中获得有用的见解。在此之前，我只了解基本图表，例如条形图，散点图，直方图等，这些基本图表内置在tableau中，而Power BI则用于数据可视化。通过每天完成此任务，我遇到了许多新图表，例如径向仪表盘，华夫图等。因此，出于好奇，最近我正在搜索数据可视化中使用的所有图表类型，这些词云引起了我的注意，我发现它非常有趣。之后，我尝试使用Tableau和Power BI中的少量数据来制作词云，在成功尝试之后，我想通过使用条形图，饼图和其他图表的代码来尝试使用它。词云是什么？定义：词云是一个简单但功能强大的可视化表示对象，用于文本处理，它以更大，更粗的字母和不同的颜色显示最常用的词，单词的大小越小，重要性就越小。

词云的用途

1．社交媒体上的热门标签（Instagram，Twitter）：全世界的社交媒体都在寻找最新的趋势，因此，我们可以获取人们在其帖子中使用最多的标签来探索最新的趋势。

2．媒体中的热门话题：分析新闻报道，我们可以在头条新闻中找到关键字，并提取出前n个需求较高的主题，来获得所需的结果，即前n个热门媒体主题。

3．电子商务中的搜索词：在电子商务购物网站中，网站所有者可以制作被搜索次数最多的购物商品的词云，这样，他就可以了解在特定时期内哪些商品需求量最大。让我们开始使用Python来实现词云首先，我们需要在jupyter notebook中安装所有库。在python中，我们将安装一个内置库wordcloud。在Anaconda命令提示符下，输入以下代码：pip install wordcloud

如果你的anaconda环境支持conda，请输入：conda install wordcloud

这可以直接在notebook中实现，只需在代码的开头添加“！”即可。像这样：！pip install wordcloud

但现在我想生成拥有任何主题的维基百科文本的词云，因此，我将需要一个Wikipedia库来访问Wikipedia API，可以通过在anaconda命令提示符下安装Wikipedia来完成，如下所示：pip install wikipedia

现在我们还需要其他一些库，它们是numpy，matplotlib和pandas。截至目前，我们需要的库就安装好了import wikipedia

result＝ wikipedia．page（＂MachineLearning＂）

final＿result ＝ result．content

print（final＿result）

机器学习维基百科页面的输出：