用 Jupyter Notebook 编写的库

NIRFTL-pdf

使用 pdfquery 和 pandas 从 nirf pdf 中提取数据。
  • 1
  • GNU General Public License v3.0 only

Emotions-Classification

告诉您句子的情感/情感分析。
  • 1

python

模块化程序和数据可视化(作者:devinmcmurrey)。
  • 1

whisper-openai

尝试一下 Whisper,OpenAI 的语音文本模型。
  • 1

NLP-CNN-Subreddit-Sorter-Heroku-App

使用卷积神经网络端到端开发一个应用程序,向用户/版主建议帖子实际属于哪个 Reddit 技术子版块。确定 CNN 滤波器数量的新方法。自定义 Word2vec 嵌入。所选择的子版块都是技术性的且相似的,并且有利于对数据科学和相关领域感兴趣的用户/版主。 (探索性数据分析、特征工程、自定义 word2vec 嵌入、卷积神经网络、通过 Flask 进行部署。
  • 1

Predicting-Length-of-Stay-w-Boosting-algorithms

使用 Booster 算法预测医疗保健住院时间。
  • 1
  • MIT

tensorflow-nanoGPT

示例如何训练 GPT-2 (XLA + AMP)、导出到 SavedModel 并使用 Tensorflow Serving 提供服务。
  • 1
  • MIT

apartment_recommender_streamlit_app

Streamlit 应用程序使用 Airbnb kaggle 数据集推荐西雅图的公寓:https://www.kaggle.com/code/rdaldian/airbnb-content-based-recommendation-system/data?select=listings.csv。
  • 1
  • GNU General Public License v3.0 only

CSGO-Pro-Gear-Performance-and-EDA

专业建模 (CS:GO) 玩家基于装备和设置的准确度表现以及探索性数据分析。
  • 1

Fake-News-Detection-for-statements-in-Polish-Language

华沙理工大学 MINI 学院论文主题的硕士论文存储库。
  • 1

hngpt

收集我最喜欢的浪链黑客新闻故事。
  • 1
  • MIT

Analise-de-Churn-Rate

流失率分析是企业客户取消服务的分类,使用 Python(Pandas 和 Plotly Express)。
  • 1

Machine_Learning_and_Deep_Learning_models

包含基于机器学习和深度学习思想的模型的存储库。
  • 1
  • The Unlicense

Digital-Learning-During-COVID19-EDA

在这个项目中,我们将使用数据分析工具来找出数字学习的趋势以及它如何对即兴社区有效。我们将比较各地区和州的人口统计、互联网接入、学习产品接入和财务等因素。
  • 1
  • Apache License 2.0

covid_project

我们的数据世界提供的 COVID-19 数据集的数据分析项目。
  • 1

domaine-nc-jupyter-notebook

Jupyter Notebook 用于分析新喀里多尼亚的域名。
  • 1
  • GNU General Public License v3.0 only

KunOnYomiFrequency

最常用汉字字符的最常见可能读法。
  • 1

search-engine

从使用“网络抓取”获得的 YouTube 视频创建的全栈搜索引擎。
  • 1
  • GNU Affero General Public License v3.0

Fail-To-Deliver

可视化未能提供来自美国证券交易委员会 (SEC) 的 (FTD) 数据。
  • 1

Data_Engineering_Data_Modeling_with_Postgres

该项目的目标是对音乐公司“Sparkify”的用户活动数据进行建模,以使用 Python 在 Postgres 中创建数据库和 ETL 管道。
  • 1