用 Jupyter Notebook 编写的库
NLP-CNN-Subreddit-Sorter-Heroku-App
使用卷积神经网络端到端开发一个应用程序,向用户/版主建议帖子实际属于哪个 Reddit 技术子版块。确定 CNN 滤波器数量的新方法。自定义 Word2vec 嵌入。所选择的子版块都是技术性的且相似的,并且有利于对数据科学和相关领域感兴趣的用户/版主。 (探索性数据分析、特征工程、自定义 word2vec 嵌入、卷积神经网络、通过 Flask 进行部署。
- 1
apartment_recommender_streamlit_app
Streamlit 应用程序使用 Airbnb kaggle 数据集推荐西雅图的公寓:https://www.kaggle.com/code/rdaldian/airbnb-content-based-recommendation-system/data?select=listings.csv。
- 1
- GNU General Public License v3.0 only
Digital-Learning-During-COVID19-EDA
在这个项目中,我们将使用数据分析工具来找出数字学习的趋势以及它如何对即兴社区有效。我们将比较各地区和州的人口统计、互联网接入、学习产品接入和财务等因素。
- 1
- Apache License 2.0
Data_Engineering_Data_Modeling_with_Postgres
该项目的目标是对音乐公司“Sparkify”的用户活动数据进行建模,以使用 Python 在 Postgres 中创建数据库和 ETL 管道。
- 1