python常用人工智能库

人工智能 2026-03-13 09:36:41
分类库名称 (PyPI包名)官方文档地址主要用途
计算机视觉OpenCV (opencv-python)https://docs.opencv.org/4.x/index.html图像处理、视频分析、传统CV算法(基石)
计算机视觉Albumentations (albumentations)https://albumentations.ai/docs/高性能图像增强/数据augmentation(深度学习训练必备)
计算机视觉MediaPipe (mediapipe)https://google.github.io/mediapipe/实时人脸、手势、姿态估计(跨平台、易用)
计算机视觉Detectron2 (detectron2)https://detectron2.readthedocs.io/Facebook出品,高性能目标检测与实例分割
深度学习框架PyTorch (torch)https://pytorch.org/docs/stable/index.html动态图框架,学术界首选,大模型开发标准
深度学习框架TensorFlow (tensorflow)https://www.tensorflow.org/api_docsGoogle出品,工业界部署成熟,支持静态图
深度学习框架Keras (keras)https://keras.io/api/高层API,现独立运行但也作为TF默认接口,极简上手
深度学习框架JAX (jax)https://jax.readthedocs.io/Google新星,函数式编程,自动微分极强,适合科研
自然语言处理Transformers (transformers)https://huggingface.co/docs/transformers/HuggingFace出品,NLP事实标准,海量预训练模型
自然语言处理spaCy (spacy)https://spacy.io/api工业级NLP库,专注于实体识别、分词等高效处理
自然语言处理NLTK (nltk)https://www.nltk.org/经典教学库,适合语言学分析和教育
传统机器学习Scikit-learn (scikit-learn)https://scikit-learn.org/stable/经典机器学习算法全集(SVM, 随机森林, 聚类等)
传统机器学习XGBoost (xgboost)https://xgboost.readthedocs.io/梯度提升树,表格数据竞赛王者
传统机器学习LightGBM (lightgbm)https://lightgbm.readthedocs.io/微软出品,比XGBoost更快,适合大数据量表格
传统机器学习CatBoost (catboost)https://catboost.ai/en/docs/Yandex出品,对类别特征处理极佳
数据科学基础NumPy (numpy)https://numpy.org/doc/多维数组运算,所有AI库的底层基石
数据科学基础Pandas (pandas)https://pandas.pydata.org/docs/数据处理、清洗、分析(类似Excel编程版)
数据科学基础SciPy (scipy)https://docs.scipy.org/doc/scipy/科学计算算法库(积分、优化、信号处理)
数据科学基础Matplotlib (matplotlib)https://matplotlib.org/stable/contents.html基础绘图库,用于数据可视化
数据科学基础Seaborn (seaborn)https://seaborn.pydata.org/基于Matplotlib的高级统计绘图,更美观
强化学习Gymnasium (gymnasium)https://gymnasium.farama.org/强化学习环境标准接口(原Gym的维护版)
强化学习Stable-Baselines3 (stable-baselines3)https://stable-baselines3.readthedocs.io/基于PyTorch的高质量RL算法实现(PPO, DQN等)
模型部署/服务ONNX Runtime (onnxruntime)https://onnxruntime.ai/docs/跨平台模型推理引擎,用于部署训练好的模型
模型部署/服务FastAPI (fastapi)https://fastapi.tiangolo.com/快速构建AI模型API服务接口

 

1. 生成式 AI (AIGC) & 扩散模型

目前最火热的领域,用于生成图像、音频和视频。

 

库名称官方文档/地址主要用途
Diffusershttps://huggingface.co/docs/diffusersHuggingFace出品,生成图像/音频/视频的核心库 (Stable Diffusion, Sora类模型)。
Gradiohttps://www.gradio.app/docs快速为AI模型构建Web演示界面,几行代码即可分享模型。
Streamlithttps://docs.streamlit.io比Gradio更灵活的数据科学Web应用框架,常用于展示AI Dashboard。
Automatic1111 WebUIhttps://github.com/AUTOMATIC1111/stable-diffusion-webui(非库,是项目) 最著名的Stable Diffusion本地运行界面源码。
ComfyUIhttps://github.com/comfyanonymous/ComfyUI基于节点流程图的SD运行器,适合复杂工作流编排。

2. 大语言模型 (LLM) 应用开发

用于构建基于 LLM 的应用程序(如聊天机器人、RAG系统、Agent)。

 

库名称官方文档/地址主要用途
LangChainhttps://python.langchain.com/docsLLM应用开发的“胶水”框架,连接模型、向量数据库和工具。
LlamaIndexhttps://docs.llamaindex.ai专注于数据索引和检索增强生成 (RAG),让LLM能读取私有数据。
Haystackhttps://haystack.deepset.ai/另一款强大的开源NLP框架,专注于搜索和问答系统。
vLLMhttps://docs.vllm.ai/高性能LLM推理和服务库,吞吐量比原生HF高数倍。
Ollamahttps://ollama.com/(工具/库) 本地轻松运行开源大模型 (Llama3, Mistral等) 的工具。

3. 图神经网络 (Graph Neural Networks)

处理社交网络、分子结构、知识图谱等非欧几里得数据。

 

库名称官方文档/地址主要用途
PyTorch Geometric (PyG)https://pytorch-geometric.readthedocs.ioPyTorch生态中最流行的图深度学习库。
DGL (Deep Graph Library)https://docs.dgl.ai/由AWS支持,性能极强,支持多后端 (PyTorch, MXNet, TensorFlow)。
NetworkXhttps://networkx.org/documentation/经典图论库,用于创建、操作和研究复杂网络结构(非深度学习,偏算法)。

4. 自动机器学习 (AutoML)

自动化模型选择、超参数调优和特征工程。

 

库名称官方文档/地址主要用途
Optunahttps://optuna.readthedocs.io下一代超参数优化框架,动态剪枝,效率极高。
Ray Tunehttps://docs.ray.io/en/latest/tune/分布式超参数调优,可扩展到大规模集群。
Auto-sklearnhttps://automl.github.io/auto-sklearn/基于Scikit-learn的自动机器学习工具。
H2O.aihttps://docs.h2o.ai/h2o/latest-stable/h2o-docs/index.html企业级AutoML平台,支持分布式训练。

5. 语音与音频处理 (Audio/Speech)

 

库名称官方文档/地址主要用途
Librosahttps://librosa.org/doc/音频分析和音乐信息检索的标准库 (提取MFCC, 节拍等)。
SpeechRecognitionhttps://pypi.org/project/SpeechRecognition/简单的语音转文字 (STT) 接口,支持多种引擎 (Google, Sphinx等)。
Whisperhttps://github.com/openai/whisperOpenAI开源的强力语音识别模型,支持多语言和翻译。
Torchaudiohttps://pytorch.org/audio/PyTorch官方的音频处理扩展。
ESPnethttps://espnet.github.io/espnet/端到端语音处理工具包 (ASR, TTS, 语音翻译)。

6. 推荐系统 (Recommendation Systems)

 

库名称官方文档/地址主要用途
Surprisehttp://surpriselib.com/专门用于构建和分析推荐系统的Scikit-learn风格库。
LightFMhttps://making.lyst.com/lightfm/混合推荐系统库,结合协同过滤和内容特征。
RecBolehttps://recbole.io/统一的推荐系统库,包含大量SOTA算法。

7. 时间序列分析 (Time Series)

 

库名称官方文档/地址主要用途
Prophethttps://facebook.github.io/prophet/Facebook出品,适合具有季节性效应的商业预测,易用性强。
Statsmodelshttps://www.statsmodels.org/stable/统计建模库,包含ARIMA, VAR等传统时间序列算法。
Dartshttps://unit8co.github.io/darts/统一的时间序列预测库,融合传统统计和深度学习模型。

8. 模型解释性与可视化 (Explainability & Vis)

 

库名称官方文档/地址主要用途
SHAPhttps://shap.readthedocs.io/解释任何机器学习模型的输出 (特征重要性分析)。
LIMEhttps://github.com/marcotcr/lime局部可解释模型无关解释,理解单个预测的原因。
TensorBoardhttps://www.tensorflow.org/tensorboard可视化训练过程 (损失曲线, 计算图, 直方图),也支持PyTorch。
Weights & Biases (wandb)https://docs.wandb.ai/云端实验追踪、可视化和协作平台 (工业界标准)。

9. 数据处理与大数据集成

 

库名称官方文档/地址主要用途
Polarshttps://docs.pola.rs/基于Rust编写的超快DataFrame库,Pandas的现代替代品,支持懒执行。
Daskhttps://docs.dask.org/并行计算库,让Pandas/NumPy能处理超出内存的大数据集。
Vaexhttps://vaex.io/docs/用于处理十亿级行数据的Lazy DataFrame库。
Apache Spark (PySpark)https://spark.apache.org/docs/latest/api/python/大数据处理引擎的Python接口,适合海量数据ETB级处理。

10. 模型压缩与量化

 

库名称官方文档/地址主要用途
Bitsandbyteshttps://github.com/TimDettmers/bitsandbytes8-bit/4-bit 量化库,让大模型能在消费级显卡上运行。
GGUF / llama.cpphttps://github.com/ggerganov/llama.cpp(C++核心,有Python绑定) 极高效的CPU/GPU混合推理,量化模型事实标准。
TensorRThttps://docs.nvidia.com/deeplearning/tensorrt/NVIDIA出品,极致优化的推理引擎 (需特定硬件)。

 

...全文
31 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

4

社区成员

发帖
与我相关
我的任务
社区描述
学习交流人工智能相关算法及技术栈
opencv计算机视觉人工智能 技术论坛(原bbs) 广东省·深圳市
社区管理员
  • 亿只小灿灿
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧