简历-中文
个人简历
张家华 | 邮箱:Jzhang132@e.ntu.edu.sg | https://mahiruoshi.github.io
教育背景
南洋理工大学,新加坡 | 2022年8月 - 至今
计算机与数据科学学院
计算机科学工学学士学位(四年级)
已发表论文
Zhang, J., Tian Y. DiffiT-HSFDA: A Diffusion Vision Transformers for Source-Free Domain Adaptation in Histology [ICIC 2025 Oral] https://link.springer.com/chapter/10.1007/978-981-95-0030-7_26
Zhang, C., Wang, X., Zhang, J. et al. VESC: a new variational autoencoder based model for anomaly detection. Int. J. Mach. Learn. & Cyber. 14, 683–696 (2023). https://doi.org/10.1007/s13042-022-01657-w
Zhang, C., Wang, X., Zhang, H., Zhang, J., Zhang, H., Liu, C., & Han, P. LayerLog: Log sequence anomaly detection based on hierarchical semantics. Applied Soft Computing (2022). https://doi.org/10.1016/j.asoc.2022.109860
实习
广州医科大学 – 移植科 | 实验员(技术总架构) | 2024年6月 - 至今
南洋理工大学李光前医学院MAVIT实验室 – 杨思勇助理教授 | 专业实习 | 2024年12月 - 2025年6月
广州医科大学 – 胸外科 | 实验员(技术-域适应) | 2024年8月 - 至今
浦项科技大学 - DPNM实验室 – 洪元基教授 | PSP项目暑期实习生 | 2024年6月 - 2024年8月
南洋理工大学 - S-Lab先进智能实验室 | 学生助理 | 2024年3月 - 2024年6月
深圳乐虾科技公司 | 全栈工程师实习 | 2023年12月 - 2024年2月
研究项目简介
整合多组学标志物以优化肺移植受者的预后预测 | 2025年5月 - 至今
由何建行教授以及梁景皓博士牵头,我正在参与一个多中心回顾性队列研究。项目组的主要成员是广州医科大学的研究生以及NTU学生,其中我负责核心技术架构以及相关的训练工作。具体而言,面对肺移植相关的挑战,我们设计了一个基于超图迁移的多模态预测网络。目前模型已经在主要中心以及多个公共数据集取得了良好的效果(500例患者的C index>0.75),我们正在完善研究,预期在年底或2026年公开我们的研究成果。
肺部肿瘤手术中冰冻切片快速诊断的应用研究 | 2024年8月 - 至今
与广州医科大学胸外科部门合作,我在针对肺癌组织病理学图像的视觉基础模型项目中负责域迁移部分的研究。我的主要研究挑战是染色方式变化的跨域迁移场景下,弱监督分割算法面对的ROI激活问题。在研究中(已被ICIC2025录用),我们提出了一套基于扩散的无源域适应流程,实现了高准确度的分割性能。
多模态大语言模型在医学场景下的应用 | 2024年2月 - 至今
这是我毕业设计以及专业实习的主题,我正在开发一个LLaVA风格的多模态模型,使大语言模型能够通过基于图的表征和上下文学习理解高维医疗影像。这种方法消除了大量微调的需求,并且利用提示工程和情景学习来解决专家小模型泛化能力有限的问题,在临床环境中支持无感知用户体验,同时保持预测的高准确性。该方法在组织病理学以及fMRI模态上实现了不亚于迁移学习的性能,初步研究已被PRIME-MICCAI录用,我正在继续推进其作为我的毕业设计,并且计划在会议现场分享更多发现。
过往项目简介
移动应用医学图像分割以及边缘计算临床数据分析:在浦项科技大学的暑期项目中,我设计了一个基于卷积网络的扩散去噪流程,用于MRI/X光图像分割和脊柱疾病诊断分类工作,在BUU和腰椎MRI数据集上提升了性能。在后续研究中,我应用特征学习和自然语言处理技术分析医院主诉,评估聚类模型和TF-IDF等向量化方法,开发了针对边缘计算环境优化的轻量级算法,用户对系统存在的感知最小。
视频质量增强:在S-Lab的实习中,我通过应用噪声检测算法和性能评估基准标签预处理技术,改善了AI生成视频的视频质量。
为大语言模型集成TTS API:我开发并发布了一个GitHub仓库,将VITS语音合成API与包括ChatGPT在内的大语言模型集成,在视频制作和直播应用的内容创作者中获得了广泛应用:https://github.com/Paraworks/vits_with_chatgpt-gpt3
部署在Hugging Face的在线TTS推理网站:我使用Hugging Face容器构建并部署了面向在线视频制作者的语音合成推理平台:https://huggingface.co/spaces/Mahiruoshi/BangDream-Bert-VITS2
研究兴趣与技能
研究兴趣:多模态机器学习、域适应与迁移学习、计算机视觉与图像处理、提示工程、情景学习、图神经网络、无监督学习与数据挖掘
技术技能:
- PyTorch及相关计算机视觉、变换器、几何、音频处理工具包
- 使用大型集群服务器进行大模型开发
- 全栈软件和网站开发:Jinja2、Flask、.NET、ABP、Vue、React、MySQL、Android开发、Unity
- 数据获取、数据预处理、网络爬虫技术
课外学习
加州大学洛杉矶分校 | 2023年6月 - 8月
夏季交流项目
全球交流模块(GEM),道德哲学
大规模开放在线课程
MIT教授:Path Academics机器学习在线研究研讨会
Coursera历史学、语言学、哲学和精神分析课程
南洋理工大学IET俱乐部(工程技术学会) | 2022年8月 - 2023年5月
活动经理
为IET会员和南洋理工大学学生组织IT导向的活动和竞赛