===== 学术活动 ===== ^时间^主讲人^内容^备注^ |2023.3.12|李嘉|国外成熟开源数据集经验分享| | |2023.4.23|water|爬虫分享| | |2023.5.28|红酒烩香鸡、花火火|低质量语料识别讨论会| [[学术活动:中文低质量文本清洗整理(红酒烩香鸡) | 中文低质量文本清洗整理(红酒烩香鸡)]]、[[学术活动:低质量语料清洗的现有状况调研及评价(花火火) | 低质量语料清洗的现有状况调研及评价(花火火)]] | |2023.9.4|李嘉|问答语料小组头脑风暴| | |2024.1.20|明心|用大模型处理中文语料(一):技术背景| | |2024.1.27|明心|用大模型处理中文语料(二):实际操作| | |2024.8.17|笑将|处理epub数据的经验分享| | |2024.9.12|红酒烩香鸡|梳理和总结多模态基础及其数据| |