2 12 3

Guan

Guan123

guankaisi

AI & ML interests

None yet

Recent Activity

upvoted a paper 18 days ago

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

updated a model 22 days ago

Guan123/baichuan_7b_ecommerce

upvoted a paper about 2 months ago

Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation

View all activity

Organizations

upvoted a paper 18 days ago

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published 19 days ago • 198

updated a model 22 days ago

Guan123/baichuan_7b_ecommerce

Updated 22 days ago • 23

upvoted a paper about 2 months ago

Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation

Paper • 2510.01284 • Published Sep 30 • 32

authored a paper about 2 months ago

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Paper • 2510.03117 • Published Oct 3 • 11

upvoted a paper about 2 months ago

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Paper • 2510.03117 • Published Oct 3 • 11

commented a paper about 2 months ago

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Paper • 2510.03117 • Published Oct 3 • 11 •

updated a dataset about 2 months ago

Aimind-dataset-share/vgg-subdataset

Viewer • Updated Sep 30 • 9.37k • 12

updated a model about 2 months ago

Aimind-dataset-share/ckpt

Updated Sep 30

published 2 models about 2 months ago

Aimind-dataset-share/vgg-subdataset

Updated Sep 30

Aimind-dataset-share/ckpt

Updated Sep 30

published a dataset about 2 months ago

Aimind-dataset-share/vgg-subdataset

Viewer • Updated Sep 30 • 9.37k • 12

Guan

AI & ML interests

Recent Activity

Organizations

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Guan123/baichuan_7b_ecommerce

Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction

Aimind-dataset-share/vgg-subdataset

Aimind-dataset-share/ckpt

Aimind-dataset-share/vgg-subdataset

Aimind-dataset-share/ckpt

Aimind-dataset-share/vgg-subdataset

Aimind-dataset-share/very-very-large

Aimind-dataset-share/very-very-large

Aimind-dataset-share/very-very-large

Guan

AI & ML interests

Recent Activity

Organizations

Guan123's activity