Profile Website of Du Yu
杜宇(@duyu09)个人官方网站
Trang Web Chính Thức Cá Nhân Của Đỗ Vũ (@duyu09)
基本情况
基本信息
  • 姓名:杜宇 (英语:Du Yu;越南语:Đỗ Vũ)
  • 年龄:2002年09月(2025年 23周岁)
  • 生源地:山东省济南市
  • 政治面貌:共青团员
本科背景
  • 学历及毕业院校:齐鲁工业大学(山东省科学院)2025年 本科应届毕业生
  • 专业:软件工程
  • 专业课及排名:前5%;主要专业课包括:数据结构、C语言程序设计、Java面向对象程序设计、Python程序设计、前端设计与开发、人工智能、数据库原理、操作系统、软件工程、软件项目管理等课程。
深造情况
兰州交通大学计算机科学与技术2025级硕士研究生在读,师从陈梅教授,主要研究方向:机器学习数据挖掘

faculty.lzjtu.edu.cn

兰州交通主页主页平台管理系统 -- 杜宇

杜宇,男,山东济南人,齐鲁工业大学(山东省科学院)软件工程专业本科,兰州交通大学计算机科学与技术硕士在读,主要研究方向:机器学习与数据挖掘。所学专业:计算机科学与技术;学位:硕士研究生;状态:在读

个人简介
在校成绩优异,基础扎实,曾获院校一等奖学金以及多项计算机学科竞赛奖项。本人具有良好的编码习惯,有团队精神和沟通意识。具有较强的自学意识,非常热爱计算机软件开发行业,不断渴求掌握最新的前沿技术。专业技术过硬,掌握多种编程语言,熟悉Web前后端各主流技术栈(前端:NodeJS + Vite + Vue3 + ElementPlus + ECharts + BootStrap + 原型设计;后端:Python Flask及SpringBoot + MyBatis + MQ),数据库使用过MySQL及SQLite。熟悉常见机器学习算法、深度学习算法,做过AI模型设计与训练以及LLM微调的任务;非常熟悉Python语言及其编码规范,会使用Numpy、Sklearn,、PyTorch等库。会使用VB.net的Windows客户端开发。熟悉Linux系统的使用,熟悉常见软件环境的Linux下的安装与部署。熟练使用相关编程语言IDE及Git等软件开发工具。
项目:基于深度学习算法的非侵入式电力负载分类与预测系统
本人职责与项目简介
本人职责:项目负责人、算法设计、系统架构设计、(合作)前端及小程序开发
该系统是国家超算济南中心的科研项目,是一种面向家庭用户和小规模企业的非侵入式电力负载分类与预测系统。"分类"功能可实时告知用户各电器设备的运作状态。"预测"功能则能预估用户未来短时电能消耗情况。模型设计采用级联模型结构,分类模型使用了全连接神经网络,将每种单电器与电器组合作为标签进行分类;预测模型以傅里叶变换(FFT)提取时序数据的频域特征与Transformer解码器为核心。
系统架构设计
采用适于现代化超算平台的"应用分布,算力集中"云边协同架构。包含边缘设备电能表、分布式后端、数据库、位于超算中心的分类与预测AI模型,以及位于移动设备的微信小程序客户端。后端基于Python Flask与C++(单Reactor多线程架构),数据库使用SQLite(也可轻易迁移到MySQL),消息队列使用的是RabbitMQ,前端基于类Vue3的WXML及微信开发者工具的微信小程序开发,使用的技术包括WXML + ECharts。该设计不仅易于拓展,且可解决大规模用户高并发请求的问题。
成果产出
  • 项目原型已申请国家专利,目前已进入实质审查阶段。申请号:202311231822.6
  • 项目(改进后)参加了2024年第17届中国大学生计算机设计大赛,获得山东赛区省级二等奖
  • 开源地址

GitHub

GitHub - duyu09/Powerload-Classification-and-Prediction-System: Power Load Classification and Prediction System Based on Deep Learning Algorithms. 基于深度学习算法的电力负载分类与预测系统(该项目已参加2024年第17届中国大学生计算机设计大赛4C2024)

Power Load Classification and Prediction System Based on Deep Learning Algorithms. 基于深度学习算法的电力负载分类与预测系统(该项目已参加2024年第17届中国大学生计算机设计大赛4C2024) - duyu09/Powerload-Classification-and-Prediction-System

分类分解与预测模型图示
项目视频介绍
项目:我的青春不迷茫—基于LLM与回归分析的大学生智能生涯指导大平台
智能机器人"小智同学"
基于微调的ChatGLM-3-6B大语言模型
薪资预测与技术差距分析
基于最小二乘回归分析模型的数值预测算法
系统其他功能
社团论坛、资源天地、云端自习、目标清单
  • 本人职责:项目负责人、系统架构设计、前端开发、(合作)AI模块开发、后管端后端开发
  • 该系统是一款针对解决大学生迷茫问题的多功能一站式系统。系统后台采用Java SpringBoot + MyBatis + Spring Security + RuoYi开发,前端采用SSR的NodeJS + Vite + Vue3 + ElementUI (ElementPlus) + ECharts框架,薪资数值预测模块基于statModels库,采用多项式回归分析算法训练模型。智能机器人"小智同学"则采用了微调的ChatGLM-3-6B大语言模型(清华大学THUDM开源)。
  • 项目成果:项目获得2023年中国大学生计算机设计大赛全国决赛三等奖
项目UI界面概览
项目开源地址

GitHub

GitHub - duyu09/Intelligent-Learning-Platform: 我的青春不迷茫-基于LLM与回归分析算法的大学生智能生涯指导与学习大平台 软件系统项目源代码。该项目已参加2023年第16届中国大学生计算机设计大赛4C2023。[可用于毕业设计、课程设计等]Source code tree of Intelligent Learning Platform Software System Based on LLM & Regression Analysis (ILP). This project has participated in the 16th Chinese Collegiate Computing Competition (4C2023) in 2023.

我的青春不迷茫-基于LLM与回归分析算法的大学生智能生涯指导与学习大平台 软件系统项目源代码。该项目已参加2023年第16届中国大学生计算机设计大赛4C2023。[可用于毕业设计、课程设计等]Source code tree of Intelligent Learning Platform Software System Based on LLM & Regression A...

项目视频介绍
项目:“政法智言”大模型 (Lexipolis-9B-Chat)
政法智言大模型 (英语:Lexipolis Large-scale Language Model;越南语:Mô Hình Ngôn Ngữ Quy Mô Lớn Chính Pháp Trí Ngôn) 是一款针对政治、法律、公文撰写领域文本优化的大规模语言模型。
项目概述
政法智言大模型v1.0 (Lexipolis-9B-Chat) 由清华大学THUDM开源的GLM-4-9B-Chat微调得到。模型基于Llama Factory框架,采用LoRA算法进行微调。
增量预训练(Pretrain)
使用的数据集包含涉政新闻、工作汇报、国家法律法规条文、领导人讲话语录、政法课程教材、公文、国家部门章程,数据量约1GB。
指令监督微调(SFT)
使用的数据包含案件审判(案件事实与审判结果对齐)、法条引用(案件事实与法条引用对齐)、指令理解语料(撰写"涉政新闻"的指令与涉政新闻内容对齐等),数据量约550MB。
  • 个人职责:项目负责人、数据清洗、模型微调
  • 项目开源地址

GitHub

GitHub - duyu09/Lexipolis-9B-Chat: 政法智言大模型v1.0(Lexipolis-9B-Chat)

政法智言大模型v1.0(Lexipolis-9B-Chat). Contribute to duyu09/Lexipolis-9B-Chat development by creating an account on GitHub.

huggingface

Duyu/Lexipolis-9B-Chat · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

参与项目:齐鲁工业大学(山东省科学院)自然语言处理课题组官方网站
项目概述
2023年03月~2023年09月。本人参与了齐鲁工业大学(山东省科学院)自然语言处理与认知计算研究团队官方网站前端的开发工作,基于Vite + Vue3 + ElementUI + BootStrap + v-mdeditor技术栈为QLU-NLP研究团队的老师们开发其个人主页、团队科研成果与团队新闻页面,并负责Linux服务端优化与运维的工作。目前项目已接近尾声,即将上线,将取代学校给每个课题组默认的网站。
技术栈
  • Vite + Vue3
  • ElementUI + BootStrap
  • v-mdeditor
  • Linux服务端
本人职责
前端开发(3人合作完成前端 + 3人合作完成后端)
项目开源地址

GitHub

GitHub - duyu09/QLU-NLP-Laboratory: 齐鲁工业大学(山东省科学院) 自然语言处理与认知计算研究团队官方网站 (源代码仓库) Source code tree of official website of Research Group for Natural Language Processing and Cognitive Computing of Qilu University of Technology (Shandong Academy of Sciences)

齐鲁工业大学(山东省科学院) 自然语言处理与认知计算研究团队官方网站 (源代码仓库) Source code tree of official website of Research Group for Natural Language Processing and Cognitive Computing of Qilu University of Technology (Shandong...

DAPC(音频处理器核心)
软件概述
DAPC是本人开发的一款使用Python和C语言编写的,并基于Numpy和Scipy以及Sonic Lib和FFMPEG的音频处理软件
功能特性
变换采样格式,增益衰减,声道混缩,混响回声效果,调整速度与音调,剪切,混合,添加静音,淡入淡出效果,FFT滤波,3D环绕音效等
技术实现
纯dapc仅可处理PCM信号,编码与解码的工作配合FFMpeg完成。
发布情况
目前dapc已被封装为拓展库并于Pypi发布,全球的Python开发者均可下载安装使用
项目开源地址

GitHub

GitHub - duyu09/Duyu-Audio-Processor-Core: Source code tree of Duyu Audio Processor Core. Based on Numpy, Scipy, Sonic Library and FFmpeg. It can process mainstream format audio files, such as: transform sampling format, gain attenuation, channel mixing, reverberation echo effect, adjust speed and tone, cut, blend, add mute, fade in fade out effect, FFT filter, 3D surround sound effect,etc.

Source code tree of Duyu Audio Processor Core. Based on Numpy, Scipy, Sonic Library and FFmpeg. It can process mainstream format audio files, such as: transform sampling format, gain attenuation, c...

DAPC库 安装及使用方法
DAPC已于2024年发布至Pypi,全球几乎各镜像站均已同步。您可以使用pip或conda下载安装DAPC。
pip install dapc==3.5.2
DAPC软件的命令行帮助
dapc -h 或 dapc --help
DAPC软件基本命令行格式
dapc -i <inputFile> -o [outputFile] --output-option [sampleRate] [bitDepth]
一键下载DAPC软件
请根据您的操作系统选择合适的可执行文件下载。
Windows x86-64
科研项目:多模态特征融合的医学影像与文本联合分析模型
该项目是国家超算济南中心的科研项目,目前已申请专利,申请号:202411785568.9
本科毕业设计项目:“明康慧医”——基于LLM与多模态人工智能的健康管理与辅助诊疗系统设计与实现
项目名称:“明康慧医”——基于LLM与多模态人工智能的健康管理与辅助诊疗系统设计与实现 英语: Design and Implementation of Minh Khoe Tue Y - a Health Management and Assisted Diagnosis System Based on LLM and Multimodal Artificial Intelligence (Abbreviation: Minh Khoe Tue Y Smart Healthcare System, MKTY)越南语: Minh Khỏe Tuệ Y – Thiết kế và triển khai hệ thống quản lý sức khỏe và hỗ trợ chẩn đoán y tế dựa trên LLM và trí tuệ nhân tạo đa mô thức (Tên Viết Tắt: Minh Khỏe Tuệ Y – Hệ Thống Y Liệu Trí Tuệ, MKTY)
DOI: 10.5281/zenodo.17444889

Zenodo

Minh Khoe Tue Y Smart Healthcare System

Minh Khoe Tue Y Smart Healthcare System v1.1.2 Release on Oct. 26, 2025. Author: Du Yu (杜宇; @duyu09, [email protected]) Repository: https://github.com/duyu09/MKTY-System LLM weights for non-Chinese developers: https://huggingface.co/Duyu/MKTY-3B-Chat LLM weights for Chinese developers: https://hf-mirror.com/Duyu/MKTY-3B-Chat or https://www.modelscope.cn/models/duyu09/MKTY-3B-Chat Bachelor's Thesis: https://github.com/duyu09/MKTY-System/blob/main/docs/MKTY-Paper.pdf Project Introduction     The M

项目概要
在新时代互联网应用与技术进一步普及与人工智能技术飞速发展的双重驱动下,计算机技术在医健领域的应用可谓愈加广泛,大众对医健日渐增加的需求难以为传统的诊疗与保健管理模式所满足,其面临的诸多如诊断效率低下、医资配置不均、患者不便利与决策依赖经验等问题已相对严重。因此,如何利用互联网与前沿的人工智能技术,特别是利用大规模语言模型(LLM)与多模态技术来提升医疗保健相关业务的数字化、智能化已成为一个重要的课题。为更好地探讨互联网技术以及大语言模型与多模态等AI技术在医疗领域的潜力,本研究设计并实现了明康慧医——基于LLM与多模态人工智能的健康管理与辅助诊疗系统,本人同时也为提高医患交流效率和优化诊疗的流程尽一份作为本科毕业生的微薄之力。
    本平台是一个集注册登录、个人信息管理、多模态智能辅诊、医疗问答、诊疗论坛、病历管理、诊疗事项清单管理、资源中心及后台管理九大模块于一体的分布式系统平台。系统宏观架构采用前后端分离设计,业务逻辑层后端基于Python Flask框架,数据库采用MySQL的方案,RabbitMQ实现完成业务逻辑端与智能服务端的异步消息通信,构建分布式微服务部署;前端页面组件化与交互效果采用Vue3axiosElement Plus实现,系统鉴权通过JWT机制实现,保障数据的安全。
    在AI智能服务端方面,“智能多模态辅诊”基于BioMedCLIP对比学习模型与MarianMTModel中英文神经机器翻译模型的级联架构,通过输入的医学影像,计算多条待判中文诊断描述为正确的相对概率分布。医疗问答、问题深度研究及其它语言生成任务均利用MKTY-3B-Chat大模型。该LLM以Qwen2.5-3B-Instruct为底座,采用LLaMA-Factory利用大量医学领域文本微调而成。问题深度研究模块基于“大模型讨论机制”,是为本人自研的一种LLM生成模式,可充分挖掘大模型内部的知识且可引导其推理。
    “明康慧医”系统的具体设计与实现过程的描述在本文中得以完整呈现。这次研究首先明确了本系统开发的行业背景与选择上述技术路线的依据,然后在技术可行性角度,分层次解析了核心功能需求与实现方案,系统架构中各模块的工作原理与技术要点在文中以重点说明,全部性能指标在测试环节得到了覆盖测试。本人在文末总结了当前的成果,还作了后续改进方向的计划。这项医疗数字化的项目是为本人的一次探索,如能引发学生们对AI医疗的关注,吸引更多同学参与该领域,这便是本研究最大的价值所在。
关键词:医疗数字化辅助诊疗大规模语言模型多模态Vue3Python Flask
项目架构图
明康慧医大模型及智能体深度分析
    明康慧医大模型(英语:MKTY-3B-Chat Large-scale Language Model;越南语:MKTY-3B-Chat Mô hình Ngôn ngữ Quy mô Lớn)是本项目的重要组成部分,为本次本科毕业设计项目而开发。
    模型参数量3.09B,量化精度BF16,其在医学、医疗及生物学领域进行了微调与优化,其表现优于底座模型通义千问Qwen2.5-3B-Instruct。微调过程采用LoRA算法,仅针对中文语言。微调时使用增量预训练Pretrain与指令监督微调SFT两种方法,并分四个微调步骤进行,具体来说就是一轮增量预训练+一轮指令监督交替进行两次,这样做是考虑到底座模型规模不大,吸收知识的能力跟巨大规模模型相比稍逊一筹,若只进行一轮微调,那么经过SFT后大模型可能会遗忘掉其先在增量训练阶段学习到的知识,执行两轮微调可减轻大模型的灾难性遗忘。
智能体深度分析功能基于本人自研的大模型讨论机制LLMDM。该方法有智能体个数、讨论回合数与判敛阈值三个超参数,完全相同的若干大模型(MKTY-3B-Chat)在会话上下文不同时不认为是同一个智能体。第一轮讨论过程是,系统通过设置多个上下文数组模拟多个智能体,让每个智能体分别回答待深入研究的问题,然后由没有会话上文的“主持人”智能体总结各方发言。以后每轮讨论,都将上轮主持人的总结和原问题拼接合并,并由各智能体基于自己的会话上下文再分别回答合并后的prompt,最后主持人总结,周而复始,直至达到最大讨论轮次数。然后是“判敛”的过程:用BigBird将最后一轮讨论各方的输出计算句子嵌入向量,然后计算各向量两两之差的平均值,以此反应各方达成共识的程度,即讨论语义收敛程度,这个数值可供人类用户作参考。
融合文本的时间序列预测模型
    本项目中,本人基于GRU,尝试性地设计了一种基于医学文书的医疗时间序列预测模型,模型原理:主要使用门控循环单元进行初步的时间序列预测,而后通过FFT计算历史时间序列的频域,将频域中各频率序数对应的振幅向量与相位向量拼接得到频域特征,随后用BigBird提取医学文本描述的句子嵌入,利用交叉注意力机制计算出频域联合特征向量与该句子嵌入的分数矩阵,从而得出加权频域联合特征。将此特征向量拆解并求逆FFT可得到一个差值时序数据,与此同时将求逆FFT前的频域数据通过一个线性层,求得一个阈值向量,利用门控的思想将这个阈值向量与求得的差值时序数据相乘,再加到基础GRU输出的结果上,作为模型最终的输出。
    这样设计的思想在于,时间序列的频域反映了序列的整体情况,而不像时域那样局限于局部时间,计算文本特征与序列频域特征的交叉注意力因而有意义,比如以心电图举例,文本描述“心跳加速”,那么从频域角度看,这句话代表的是整个心电图波形更高频部分的振幅增大,这很容易通过交叉注意力向某高频部分的振幅加权权重增大来反映出来,而时序数据理论上无法体现。
右图展示了时序预测模型结构
开源地址
代码仓库地址:

GitHub

GitHub - duyu09/MKTY-System: [AI LLM + Medicine and Healthcare] Minh Khoe Tue Y Smart Healthcare System【人工智能大模型与医疗保健毕业设计项目】明康慧医(MKTY)智慧医疗系统)

[AI LLM + Medicine and Healthcare] Minh Khoe Tue Y Smart Healthcare System【人工智能大模型与医疗保健毕业设计项目】明康慧医(MKTY)智慧医疗系统) - duyu09/MKTY-System

明康慧医大模型权重开源地址:

huggingface

Duyu/MKTY-3B-Chat · Hugging Face

This model is a component of the "Minh Khoe Tue Y - Design and Implementation of a Health Management and Assisted Diagnosis System Based on LLM and Multimodal Artificial Intelligence" project (referred to as the Minh Khoe Tue Y Smart Healthcare System). It was developed as part of my undergraduate graduation project for the Faculty of Computer Science and Technology, Qilu University of Technology (Shandong Academy of Sciences), class of 2025. The project has been open-sourced and is available at: https://github.com/duyu09/MKTY-System.

魔塔社区

MKTY-3B-Chat

明康慧醫大規模語言模型(英語:Minh Khoe Tue Y Large-scale Language Model;越南語:Minh Khỏe Tuệ Y Mô Hình Ngôn Ngữ Quy M

本科阶段实习经历
泉城省实验室 技术保障岗 2023年10月~2024年02月
在清华大学与山东省科学院共建的泉城省实验室(又称:泉城实验室,QCL)网络空间安全治理部有过实习经历。岗位是流动科研人员技术保障岗。
岗位职责
  1. 完成法律条文数据EDA的工作,利用BERT提取法律文书中的事实和理由以及对应的法条信息,微调大语言模型,利用其实现从大量语料中筛选法律相关的文本,梳理法律依据下游任务的微调数据集。
  1. 完成COLIEE比赛任务中的法律大语言模型数据加工以及训练迭代流程设计,基于预训练模型完成给定数据集和给定任务的微调及推理验证测试工作。
  1. 完成已有开源主流大语言模型(LLM)的对比调研工作,以及基于开源模型的部署及推理测试。
技术栈、本科阶段奖项及专利
技术栈
  • 前端开发技术:掌握HTML5 + CSS3 + JS基础前端开发技术,掌握NodeJS + Vite + Vue2/3 + UI框架(ElementPlus \ BootStrap \ ECharts等)+ 原型设计等技术栈。
  • 后端开发技术:熟悉Python Flask后端框架Web全栈开发流程、掌握Java基本语法、熟悉SpringBoot + 数据库(MyBatis) + Redis + MQ技术栈。熟悉MySQL、SQLite数据库的使用。
  • Linux: 熟练使用Linux系统及各常用软件、了解Linux基本原理,熟悉Linux下多种软件及环境的安装部署。
  • 人工智能及数据科学技术:非常熟练使用Python语言,熟悉其编码规范。掌握数据处理及分析流程、熟悉Numpy, Seaborn等数据分析库,熟悉PyTorch深度学习框架,做过多次AI模型设计及训练的工作,熟悉多种机器学习、深度学习算法,了解AI领域各前沿技术,做过LLM微调的工作。
  • 开发工具:熟练上述各相关技术的IDE及Git等开发工具的使用及配置。
  • Visual Basic: 熟悉.NET环境下VB.net的桌面应用开发。
奖项
  • 2021~2022学年齐鲁工业大学(山东省科学院)一等奖学金、"三好学生"及"三好学生标兵"荣誉称号
  • 2021年第3届与2022年第4届齐鲁工业大学(省科院)与山东师范大学程序设计联赛铜奖
  • 2023年第16届中国大学生计算机设计大赛(4C2023) ILP大平台项目 全国总决赛三等奖
  • 2022年第14届全国大学生数学竞赛(非数学类) 全国一等奖
  • 2023年第14届"蓝桥杯"大赛C/C++软件组 山东赛区二等奖
  • 2023年第21届山东省大学生软件设计大赛 两个项目均获二等奖
  • 2023年第3届全国大学生人工智能知识竞赛国家级一等奖
  • 2023年中国高校计算机大赛团体程序设计天梯赛 "华山论剑"组三等奖
  • 2023年睿抗机器人开发者大赛(RAICOM)山东赛区CAIP编程技能赛 山东赛区三等奖
  • 2023年无锡国际人工智能算法大赛(基于目标检测的非机动车违停检测) 表现优异奖
  • 2023~2024年第4届全国大学生算法设计与编程挑战赛(秋季赛)A类 铜奖
  • 2024年第17届中国大学生计算机设计大赛电力负载项目 山东赛区省级二等奖
  • 2024年美国大学生数学建模大赛S奖
专利
  • 发明专利"基于深度学习的电力负荷实时分类分解方法与系统"(进入实审,申请号202311231822.6)
  • 发明专利"基于多模态特征融合的医学影像与文本联合分析模型"(已受理,申请号202411785568.9)
  • 实用新型专利"一种水冷式计算机散热器"(已授权,专利号ZL 202322391990.3)
Powered by Gamma
Copyright (c) 2021~2025 Du Yu
Made with