ming hu's picture

8

ming hu

ming0100

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding

upvoted a paper about 2 months ago

MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing

upvoted a paper about 2 months ago

SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding

Paper • 2510.06308 • Published Oct 7 • 53

upvoted 2 papers about 2 months ago

MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing

Paper • 2509.22186 • Published Sep 26 • 134

SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines

Paper • 2509.21320 • Published Sep 25 • 99

upvoted a paper 3 months ago

A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers

Paper • 2508.21148 • Published Aug 28 • 139

upvoted 3 papers 12 months ago

Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline

Paper • 2411.12814 • Published Nov 19, 2024 • 25

SegBook: A Simple Baseline and Cookbook for Volumetric Medical Image Segmentation

Paper • 2411.14525 • Published Nov 21, 2024 • 21

GMAI-VL & GMAI-VL-5.5M: A Large Vision-Language Model and A Comprehensive Multimodal Dataset Towards General Medical AI

Paper • 2411.14522 • Published Nov 21, 2024 • 39

upvoted a paper over 1 year ago

RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models

Paper • 2407.05131 • Published Jul 6, 2024 • 27