关于我: 储著敏

储著敏,男,汉族,中共党员,安徽黄山人。

  • 清华大学计算机系博士四年级在读生
  • 清华信息检索(THUIR)实验室,导师刘奕群教授
  • 主要研究方向为对话式搜索系统评价、用户行为分析

教育经历

  • [08.2015-07.2019] 清华大学 物理系 数理基础科学 (学士),GPA: 3.58 / 4.0,排名: 4 / 55 (Top 10%),物理系叶企孙奖
  • [09.2019-今] 清华大学 计算机系 计算机科学与技术 (博士),信息检索方向(导师:刘奕群教授),GPA: 3.83 / 4.0

学术论文

  • Z Chu, J Mao, F Zhang, Y Liu, T Sakai, M Zhang, S Ma. Evaluating Relevance Judgments with Pairwise Discriminative Power (CIKM 2021) Link
    • 类比信息熵提出了基于排序结果信息熵的文档相关性标注数据集评价模型
    • 量化了不同标注等级和规范下数据的可区分度
  • Z Chu, Z Wang, Y Liu, Y Huang, M Zhang, S Ma. ConvSearch: A Open-Domain Conversational Search Behavior Dataset (ArXiv 2022) Link
    • 自行构建了一套支持 Wizard-of-Oz 范式对话、专家检索行为采集、参与者对话后标注的实验平台
    • 开展了大规模用户实验,收集到富含对话行为数据和标注数据的对话共 1131 条
  • J Mao, Z Chu, Y Liu, M Zhang, S Ma. Investigating the Reliability of Click Models (ICTIR 2019, Best Short Paper Honorable Mention) Link
    • 采用变分贝叶斯推断推导出 BBM 模型在 Beta 分布下近似解的 EM 迭代计算公式
    • 提供了一套衡量点击模型预测可靠程度的评价框架
  • T Sakai, S Tao, Z Chu, M Maistro, Y Li, N Chen, N Ferro, J Wang, I Soborof, Y Liu. Overview of the NTCIR-16 We Want Web with CENTRE (WWW-4) Task (NTCIR-16) Link
    • 组织开展 NTCIR-16 WWW-4 评测,推动了社区内 ad hoc 网页搜索相关交流

实习经历

  • 搜狗: 搜索事业部研究实习生 [2021.07 - 2021.09]
    • 调研并复现最新的端到端开放域问答模型
    • 基于 EM 模型,引入 MCS 构建新的问答模型

项目经历

  • 律师评估系统构建 [2022.08-今]
    • 采用 Selenium 在公开的大规模数据中抓取符合检索条件的裁判文书数据
    • 利用文本解析技术提取裁判文书中的诉讼请求和判决结果的条款和金额信息
    • 通过 Django 框架开发网站可视化分析报告展示给客户
  • 基于机器学习的赛艇配速策略构建 [2021.03-2021.06]
    • 基于历史数据及当前时刻的其他特征,对某特定时刻东京地区的气象特征进行预测
    • 基于过往赛事数据与当前气象特征,构建赛艇选手的最优配速策略
  • 渔业环境数据采集与数据分析平台搭建 [2019.06-2020.01]
    • 利用各种传感器采集并解析出鱼塘水质的各项参数指标至树莓派上,鲁棒地缓存并传输至服务器
    • 开发网站展示可视化的鱼塘水质报告,并向客户推送水质预警信息

竞赛经历

  • 中国数学奥林匹克(CMO)银牌 [2014.12]
  • “深圳杯”数学建模挑战赛优秀论文二等奖 (ATM 交易状态特征分析与异常检测) [2017.08]
  • NTCIR-14 WWW-2 英文任务综合性能表现第一名 (ad hoc 网页检索任务) [2019.10]
  • “智荟杯”浦发百度高校极客挑战赛算法赛三等奖 (NLP2SQL 任务) [2020.12]
  • 第 27 次 CCF 计算机软件能力认证(CSP 认证) (375 分,排名前 1.27%) [2022.09]

学生工作经历

  • 清华大学物理系团委书记 [2019.08 - 2021.06]
    • 负责统筹管理物理系本科生学生社会工作全局工作
    • 因优异工作表现,获评 2019-2020 学年度清华大学优秀学生干部标兵荣誉称号
  • 清华大学安徽招生组数据负责人 [2019.06 - 2022.07]
    • 负责招生期间安徽招生组的数据传达管理,工作任务分发等
    • 因工作表现出色,获评清华大学 2021 年招生工作“优秀招生志愿者”荣誉称号

荣誉及奖项

  • 2017-2018 学年度国家奖学金
  • 2017-2018 学年度北京市三好学生
  • 2020-2021 学年度北京市优秀学生干部
  • 2020-2021 学年度清华大学“一二·九”辅导员奖

专业技能

  • 编程语言: Python, C/C++, Java, JavaScript
  • 框架和工具: Git, LaTex, Django, PyTorch, Selenium
  • 语言: 中文 (母语), 英语 (六级 569)