使用Python判断CSDN社区的成分

kilo unknwn 2025-08-27 04:20:17

无意间产生个想法上次提取关键字的那个python代码似乎功能并不止统计电子书的词频。还可以统计一些社区网页中最常出现的关键字,来帮助萌新们判断社区的成分。就拿一个叫“Linux C/C++交流 社区”的社区为例。可以获取一些无用的信息和Java、AI、DL4J、Springboot、Elasticsearch、AMiner、金融、算法、JavaCV、Kubernetes等出现频率较多的关键信息

第一步:在社区主页ctrl+a全选,划到最低端,ctrl+c复制

 

第二步:在py文件同级目录新建文本文件"社区1.txt",并将复制的内容粘贴进文本文件。

 

第三步:将文件中的地址改为“社区1.txt”(这里利用函数参数的机制在原有代码的基础上定义了个参数)

原代码

# 省略
def countr_jiebcut():
    with open("化学必修1.txt",'r',encoding="utf-8") as tst_txt:
        tst_str = tst_txt.read()
        tst_jieba_cut = jieba.cut(tst_str)
    # 省略
if __name__ == "__main__":
    countr_jiebcut()

当前代码

# 省略
def countr_jiebcut(txt="化学必修1"):
    with open(f"{txt}.txt",'r',encoding="utf-8") as tst_txt:
        tst_str = tst_txt.read()
        tst_jieba_cut = jieba.cut(tst_str)
    # 省略

if __name__ == "__main__":
    countr_jiebcut("社区1")

第四步:运行并查看结果

忽略掉无关信息,得出以下一些关键字

# Java AI DL4J Springboot Elasticsearch AMiner 金融 算法 JavaCV Kubernetes

下面是把这些关键字放在某千问AI的结果(格式不错,借鉴了)

JAVA

类别:编程语言

简介:Java是一种面向对象的高级编程语言,以其“一次编写,到处运行”(Write Once,Run Anywhere)的特性著称。具有平台无关性、强大的生态系统、自动内存管理(垃圾回收)和丰富的类库。可应用于企业级应用、Web开发、移动应用(Android)、大数据处理和嵌入式系统等领域。

相关技术/框架:Spring, Spring Boot,Hibernate,Maven,Gradle,JVM(Java Virtual Machine)

AI

类别:技术领域

简介:人工智能(artificial intelligence)曾属于计算机科学的一个分支,现如今因其可以给各种领域赋能而发展成新的技术领域。人工智能技术领域旨在为计算机、电子设备等人造器械赋予一定程度的人类智能从而完成学习、推理、解决问题、感知、语言理解等任务,AI技术广泛应用于图像识别、语音识别、自然语言处理、机器人、自动驾驶、策略辅助等领域。

相关技术/框架:机器学习(Machine Learning)、深度学习(Deep Learning)、人工神经网络(Artificial Neutal Network)、自然语言处理(Natural Language Processing)、机器视觉(Machine Vision)

DL4J-Deeplearning4j

类别:深度学习框架

简介:DL4J(Deeplearning4j)为Java和Scale设计的深度学习库。它允许开发者在JVM上搭建和训练各种深度神经网络模型,如多层感知机(Multilayer Perceptron)、卷积神经网络(convolutional neutural network)、循环神经网络(recurrent neutural network)等

相关技术/框架:Java,Spark,Hadoop,ND4j,Samediff

Springboot

类别:开发框架

简介:Spring boot 是由Pivotal团队提供的开源Java框架,旨在简化新Spring应用的初始搭建以及开发过程。他通过“约定优于配置”(Convention over Configuration)的原则,提供了开箱即用的配置,极大地减少了开发者的配置工作量,使得创建独立的生产级别的基于Spring的应用变得快速而简单。

相关技术/框架:Spring Framework,Maven/Gradle,RESTful API,Microservices

摩斯

类别:通信编码

简介:摩斯电码(Morse Code)是一种时通时断的信号代码,通过不同的排列顺序表示英文字母、数字和标点符号。它由点(·)和划(—)两种基本信号组成,曾广泛应用于早期的无线电报通信。如今,摩斯电码主要用于业余无线电、紧急求救信号和一些特定的教育或趣味场景。

相关技术/框架:电报、无线电通信、SOS求救信号

AMiner

类别:学术平台

简介:面向科学家和工程师的学术社会网络系统。它提供学者检索、学术趋势分析、合作关系发现、论文检索与推荐等功能,旨在帮助用户追踪学术前沿、发现研究热点和建立学术合作网络。

相关技术/框架:数据挖掘、知识图谱、学术搜索引擎、推荐系统

Elasticsearch-ES

类别:搜索引擎

简介:Elasticsearch(简称 ES)是一个基于 Lucene 的开源、分布式、RESTful 风格的搜索和分析引擎。它能够快速地存储、搜索和分析大量数据,常用于全文搜索、日志分析、指标监控和数据可视化等场景。Elasticsearch 通常与 Logstash 和 Kibana 组成 ELK 技术栈。

相关技术/框架:Lucene, Kibana, Logstash, ELK Stack, REST API

金融

类别:行业领域

简介:金融是货币资金融通的市场,涉及银行、证券、保险、投资、信托等多个子行业。其核心功能包括资金的融通、风险的管理、资源的配置和支付清算。现代金融与信息技术深度融合,催生了金融科技(FinTech),涵盖移动支付、P2P借贷、数字货币、智能投顾等领域。

相关技术/框架:区块链、大数据分析、人工智能、风险管理、量化交易

JavaCV

类别:计算机视觉库

简介:JavaCV 是一个 Java 接口库,封装了 OpenCV、FFmpeg 等流行的计算机视觉和多媒体处理库。它允许 Java 开发者在 JVM 上进行图像处理、视频分析、人脸识别、物体检测等操作,简化了原生 C/C++ 库在 Java 环境中的使用。

Kubernetes

类别:容器牌匾平台

简介:Kubernetes(常缩写为 K8s)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。它能够管理由 Docker 等工具创建的容器集群,提供服务发现、负载均衡、自动恢复、滚动更新和资源调度等功能,是现代云原生应用开发和运维的核心技术。

是不是应该有个宗旨什么的,那这个账号可以是:用知识帮助每一位值得帮助的人

ok,伟大的unknwn今天侵蚀的权柄为“社区成分”

参考:如何使用python统计电子书的的词频?

 

...全文
16 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

117,352

社区成员

发帖
与我相关
我的任务
社区描述
欢迎来到嵌入式交流社区.大家可以一起交流学习进步
arm开发c++linux 技术论坛(原bbs) 上海·闵行区
社区管理员
  • 泡沫o0
  • 溪渣渣_梁世华
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧