★ View & Download My Current CV (Chinese)
Created Oct 1, 2024 - Last updated: Oct 1, 2024
Done 🌳
CV
王欣洲
GitHub: https://github.com/BellowAverage
LinkedIn: https://www.linkedin.com/in/chris-wang-a4b1a9216/
Email: chriswang2025@u.northwestern.edu
Tel: (+1) 312-684-9989 | (+86) 18221546090 (WeChat)
教育背景
(美国)西北大学 – 硕士
06/2024–09/2025
专业: 数据科学
研究方向: 数据工程与人工智能
核心课程:
- 数据工程
- 人工智能与深度学习
- 数据管道与流处理
- 时间序列分析与预测
- 分析系统工程
- 自然语言处理
- 有/无监督学习模型
- 数据科学与云计算
- 知识工程
- 应用统计
- 计算机视觉
上海大学 – 悉尼科技大学 – 本科(双学位)
09/2020–06/2024
专业: 信息管理与信息系统
辅修: 工商管理
核心课程 (第一学位):
- 高等数学
- 线性代数
- 概率论与数理统计
- 数据结构
- 程序设计
- 算法设计与分析
- 系统设计与分析
- 数据库 & 数据仓库
- IT项目管理
- 机器学习与数据分析
- 金融编程
- 计算机网络
核心课程 (第二学位):
- 经济学
- 财务会计
- 管理会计
- 财务管理
- 市场营销
- 全球运营与供应链管理
- 人力资源管理
技能 & 技术栈
编程语言&框架:
- C++
- Python
- Go
- SQL
- R
- Django & Nginx & Uwsgi
- Hugo
- Pandas & Sklearn & PyTorch & TensorFlow
- Pentaho Kettle Spoon
- Unreal C++ & Blueprints
- Pygame
- Excel VBA
- Html & Css & JavaScript
环境&工具:
- Linux Ubuntu & CentOS
- Microsoft Azure & Alibaba & Tencent Cloud
- Git & GitHub
- MySQL Workbench
- Docker
- Postgres & pgAdmin4
- Microsoft PowerBI
- Elasticsearch
- Slack & Confluence & Notion
- Unreal Engine
- LobeChat
工作经验
(游戏)数据分析实习生|执行办公室,心动网络有限公司|上海
12/2023–06/2024
- 构建和开发数据驱动的自动化工作流程和工具链,提高分析效率,促进客户参与与留存: GitHub
- 日常工作:管理、处理和分析千万级用户数据;设计和开发基于网页的游戏数据分析工具;构建每周游戏数据报告的标准工作流程和自动化;形成全面的用户研究报告;向CEO业务助理汇报。
- 执行多项由高层管理直接要求的专项分析任务,包括玩家游戏资源需求分析、展示关键指标(如DAU、ARPU、LTV)的特别周报、主播广告投放与收入分成分析,以及部分游戏的收入与生命周期预测等。
- 利用数据库和数据仓库技能设计和开发结构化数据流,为一款新发布的大型手游构建数据整合工具和可视化数据看板。该系统使分析师能够避免编写繁琐的SQL,即可便捷地获取结构化或可视化的数据,并生成报告。
- 设计、开发一个可复用的基于情感分析的NLP系统,对玩家评论进行分层和评分。该系统通过使用Django框架创建的网页形式提供了一个强大的内部工具,旨在促进某些游戏产品以客户意见为导向的决策流程。
(商业)数据工程实习生|腾讯科技(北京)有限公司|北京(线上)
07/2023–09/2023
- 遵循已有设计和标准,开发和部署对用户日志数据流的实时监控系统: GitHub
- 参与利用Nginx日志模块、Hadoop、Kafka、Flume与Flink对大规模空间和非空间客户日志数据进行保护、统一及组织,同时使用Elasticsearch实现数据可视化的大型软件开发项目。这个B2B项目通过数据可视化最终显著降低了客户与营销专家之间的沟通成本。
科研助理 – 软件开发方向|上海建工集团|上海
05/2023–07/2023
- 主导学生团队设计、开发一款针对上海某大型隧道施工现场的AI智能语音助手: GitHub
- 审查并评估一系列用于自动声音识别(ASR)和文本转语音(TTS)的开闭源模块,对其中涉及的底层机器学习模型(例如用于 MASR 框架的梯度上升决策树)进行准确率、算力成本、技术复杂度等指标的评估。
- 构建进度要求、代码标准,领导团队设计、开发、整合了五个软件功能模块,包括音频录制、语音识别、聊天响应、文本转语音和语音播放;使用诸如词错误率、漏词率、词信息丢失率等多项指标完成严格测试,并部署至Linux Ubuntu服务器,投入生产环境。
开源社区项目
设计和开发集成高级检索增强生成(Advanced Retrieval-Augmented Generation)的笔记应用
04/2024–06/2024
- 这款名为Polaris Note的笔记软件集成了一个AI文本补全工具。利用主流大语言模型和特别优化设计的基于RAG的文本预测模型,将用户历史笔记内容作为用于检索的私域语料库进行增强生成,预测用户即将输入的内容,辅助用户进行文档创作: GitHub
- 使用TF-IDF方法进行预训练文档选择;采用潜在狄利克雷分配(LDA)算法提取基于写作风格的主题偏好;利用维基知识库(WIKI Knowledge Base)为RAG构建私有的、可检索的向量数据库。
- 对大型语言模型常见的,关于自回归模型的单向生成局限性和无法自我验证错误的两个主要问题,在Polaris Note的文本预测算法中应用了针对性的优化。
- (Web)应用开发层面:
- Polaris Note包含为现代化且具备商业化准备的笔记应用所设计和精心构建的模块。
- 配备了基于Cookie的用户认证、个人仪表板(Dashboard)、支持Markdown格式的由AI辅助的笔记创建和上传、笔记浏览(私密和共享)、笔记管理、针对开发者开放的控制台和应用设置等模块。
- 为所使用的技术撰写了完整的文档,包括Django、Nginx、Uwsgi的配置和使用;前端采用了原生HTML、CSS和JavaScript,以更全面地学习前端技术并兼顾软件的可扩展性。
设计、开发、部署和维护分别基于Django和Hugo的个人博客网站
12/2022–至今
- 运用新技术,设计、实现并部署了一个Hugo个人展示网站: GitHub
- 新的基于Go语言Hugo静态网页框架的,记录我的笔记和技术博客的个人网站,作为对旧网站的替换。
- 直接访问URL: https://bellowaverage.github.io/
- (旧网站,已停止维护):
- 设计、实现并部署了一个基于Django Web框架和Nginx Web服务器的个人博客网站: GitHub
- 综合使用了Django、Nginx、Uwsgi框架,并在开发过程中总结了详细的开发和部署文档;这个已弃用的网站仍托管我许多工作的API。其开发涵盖了从Django前端模板语法到后端ORM数据库构建,域名注册备案以及Linux服务器部署的一般网页应用开发的全过程。
设计和开发用于监控PC游戏平台发行和盈利分析的数据仓库
11/2022–12/2022
- 设计、原型化并验证了一个基于MySQL的数据库系统,以支持PC游戏的发行。其重点在于使用Pentaho Kettle Spoon,一个基于JavaScript的闭源数据链路工具对数据仓库进行的构建、周期性的数据同步、埋点设计。其目的在于游戏发行的数据记录和盈利分析,以支持数据驱动的策略优化: GitHub
- 构建了ER图来定义不同元素之间的关系;分析了功能依赖性,并进行了Boyce-Codd范式(BCNF)分解和第三范式(3NF)分解;综合使用MySQL Workbench和Kettle设计、实现和测试关系数据库系统。
- 使用Pentaho Kettle Spoon建立了基于提取、转换和加载(ETL)过程的数据流水线,涵盖了原始数据的收集、清洗、聚合和保存;对数据库进行了超过20万条交易历史数据的测试,涵盖了广泛的电子商务查询需求。
- 使用Microsoft PowerBI实现了数据可视化。
设计和实现基于GIS的出租车时空轨迹预测系统和其他Kaggle机器学习竞赛经历
10/2022–11/2022
- 设计、实现并测试了一个基于机器学习的工作流,用于可视化和预测大都市环境中的出租车轨迹,允许对司机进行调度指导和有效的交通管理。该项目遵循基于机器学习的数据分析的标准工作流程: GitHub
- 启用了从微软亚洲研究院的Geolife GPS V1.3数据的提取以及EDA,随后是:
- 系统性的数据清洗,以协调数据格式、减少数据噪声和消除异常
- 数据分段和语义增强
- 维度扩展
- 特征编码、归一化和维度选择
- 准备了用于支持模型构建的训练和测试数据集。
- 训练、验证和测试了一组用于驱动预测的监督学习模型,涵盖了K近邻、多元线性回归、支持向量机、随机森林和长短期记忆的神经网络等;使用适用的指标系统地评估和比较了模型性能。
- 启用了从微软亚洲研究院的Geolife GPS V1.3数据的提取以及EDA,随后是:
- 参与、提交了多个其他知名Kaggle机器学习数据分析竞赛,包括波士顿房价预测,泰坦尼克遇难分类,MNIST手写数字识别,猫狗大战图像分类,美国二手车价格预测等。
设计和开发一个增强功能的模板化虚幻引擎俯视角(TopDown)游戏框架和多款小型游戏应用
09/2021–02/2025
- 设计并开发了一个使用C++和蓝图的改进版的虚幻引擎俯视角游戏模板: GitHub
- 特色是一个用于AI逻辑的行为队列系统,可作为原版基于黑板(Blackboard)的AI方案的轻量级替代品。
- 开发了一个可扩展的程序化AI动作框架。这个框架与武器化的攻击、静态和动态对象的交互和移动、投射物阻挡检测和绕道逻辑协同工作。
- Pygame 项目:
- 设计并在Pygame中实现了一个俯视角射击游戏,涵盖了一组武器、关卡布局和分层视觉效果: GitHub
- 构建了一个合适的2D物理引擎框架来模拟物体碰撞,允许碰撞检测和平面上360度全方向的运动。
- 设计并在Pygame中实现了一个俯视角射击游戏,涵盖了一组武器、关卡布局和分层视觉效果: GitHub
- Excel VBA 项目:
- 设计并使用Excel Visual Basic for Application(VBA)实现了一个俯视角RPG游戏: GitHub
- 设计了包含玩家移动、探索、基于属性的进展和行动点的游戏机制。
- 集成了用于游戏内购买的商店系统,并实现了影响玩家属性的动态事件。
- 创建了一个后端数据分析框架来跟踪玩家行为,为平衡游戏机制和改善用户体验提供了决策依据。
- 设计并使用Excel Visual Basic for Application(VBA)实现了一个俯视角RPG游戏: GitHub
课外经历
学生主席|上海大学国际部学生会
07/2020–09/2022
- 连续2年领导一个超过30人的官方学生志愿者团队,为国际学生事务提供各种支持,服务于超过200名国际学生和外籍教职员工;协调、组织、联系了一系列有影响力的活动,旨在在海外社区推广本校。
奖项和荣誉
- (2次 2021 & 2023)二等奖|上海大学学业优秀奖学金
- 二等奖(全国总决赛)|2021 IEERA中国商务英语辩论赛
- 本科GPA前10%|GRE Verbal 160|雅思 7.5|大学英语6级