π HY3D-Bench: 22 ΡΠ΅ΡΠ°Π±Π°ΠΉΡΠ° ΠΎΡΠ±ΠΎΡΠ½ΠΎΠΉ 3D-Π³Π΅ΠΎΠΌΠ΅ΡΡΠΈΠΈ.
π HY3D-Bench: 22 ΡΠ΅ΡΠ°Π±Π°ΠΉΡΠ° ΠΎΡΠ±ΠΎΡΠ½ΠΎΠΉ 3D-Π³Π΅ΠΎΠΌΠ΅ΡΡΠΈΠΈ.
Tencent Hunyuan Π²ΡΠ²Π°Π»ΠΈΠ»ΠΈ Π² ΠΎΠΏΠ΅Π½ΡΠΎΡΡ ΠΌΠΎΠ½ΡΡΡΡΠΎΠ·Π½ΡΠΉ ΠΏΠ°ΠΊ HY3D-Bench Π½Π° 22.5 Π’Π ΠΈ ΡΡΠΎ ΠΏΠΎΠ΄Π°ΡΠΎΠΊ Π΄Π»Ρ Π²ΡΠ΅Ρ , ΠΊΡΠΎ Π·Π°Π½ΠΈΠΌΠ°Π΅ΡΡΡ 3D Gen ΠΈ ΡΠΎΠ±ΠΎΡΠΎΡΠ΅Ρ Π½ΠΈΠΊΠΎΠΉ.
ΠΠ°ΡΠ°ΡΠ΅Ρ ΡΠ°Π·Π±ΠΈΡ Π½Π° 3 Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΡ ΠΊΡΡΠΊΠ°, ΠΊΠ°ΠΆΠ΄ΡΠΉ ΠΏΠΎΠ΄ ΡΠ²ΠΎΠΈ Π·Π°Π΄Π°ΡΠΈ:
π‘Full-level Dataset (252K+ ΠΌΠ΅ΡΠ΅ΠΉ, ~11 Π’Π) ΠΠ°Π·Π° Ρ ΠΏΠΎΠ»Π½ΠΎΡΡΡΡ Π·Π°ΠΌΠΊΠ½ΡΡΠΎΠΉ Π³Π΅ΠΎΠΌΠ΅ΡΡΠΈΠ΅ΠΉ, Π±Π΅Π· Π΄ΡΡΠΎΠΊ ΠΈ non-manifold Π°ΡΡΠ΅ΡΠ°ΠΊΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠΌΠΈ ΠΎΠ±ΡΡΠ½ΠΎ ΠΊΠΈΡΠ°Ρ ΡΠΊΠ°Π½Ρ. ΠΡΠ΅ Π½ΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΎΠ²Π°Π½ΠΎ ΠΈ Π³ΠΎΡΠΎΠ²ΠΎ ΠΊ ΡΠΊΠ°ΡΠΌΠ»ΠΈΠ²Π°Π½ΠΈΡ Π² DiT ΠΈΠ»ΠΈ GAN. Π ΠΊΠΎΠΌΠΏΠ»Π΅ΠΊΡΠ΅ ΠΈΠ΄ΡΡ ΡΡΠΌΠΏΠ»Ρ ΡΠΎΡΠ΅ΠΊ ΠΈ ΠΌΡΠ»ΡΡΠΈ-Π²ΡΡ ΡΠ΅Π½Π΄Π΅ΡΡ.
π‘Part-level Dataset (240K+ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ², ~5 Π’Π) ΠΡΠ΄ Π΄Π»Ρ ΡΠΎΠ±ΠΎΡΠΎΡΠ΅Ρ Π½ΠΈΠΊΠΎΠ² ΠΈ ΡΠ΅Ρ , ΠΊΡΠΎ Π·Π°Π½ΠΈΠΌΠ°Π΅ΡΡΡ geometric perception. Π’ΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΡ Ρ ΡΠ΅ΠΌΠ°Π½ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠ΅ΠΉ Π½Π° ΡΠ°ΡΡΠΈ. ΠΡΠ»ΠΈ ΡΡΠΈΡΠ΅ ΡΠ΅ΡΠ²ΠΎΠΏΡΠΈΠ²ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π΄ΡΡΠ³Π° ΠΌΠ°Π½ΠΈΠΏΡΠ»ΡΡΠΈΡΠΌ ΠΈΠ»ΠΈ Ρ ΠΎΡΠΈΡΠ΅ Π³Π΅Π½Π΅ΡΠΈΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΡ ΠΊΡΡΠΊΠ°ΠΌΠΈ - Π²Π°ΠΌ ΡΡΠ΄Π°.
π‘Synthetic Dataset (125K+ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ², ~6.5 Π’Π) ΠΡΠ΅Π²ΠΈΠ΄Π½Π°Ρ ΡΠΈΠ½ΡΠ΅ΡΠΈΠΊΠ°, ΡΡΠΎΠ±Ρ Π·Π°ΠΊΡΡΡΡ ΡΠ΅Π΄ΠΊΠΈΠ΅ ΠΊΠ°ΡΠ΅Π³ΠΎΡΠΈΠΈ, ΠΊΠΎΡΠΎΡΡΡ Π½Π΅Ρ Π² ΠΎΠ±ΡΡΠ½ΡΡ Π΄Π°ΡΠ°ΡΠ΅ΡΠ°Ρ . ΠΡ Π²Π°Ρ - 1252 ΠΊΠ°ΡΠ΅Π³ΠΎΡΠΈΠΈ.
ΠΠ΄Π΅ΠΌ Π²ΠΎΠ»Π½Ρ SOAT-level 3D-Π³Π΅Π½Π΅ΡΠ°ΡΠΎΡΠΎΠ², Π΄ΠΎΡΡΠ½Π΅Π½Π½ΡΡ Π½Π° ΡΡΠΎΠΌ Π½Π°Π±ΠΎΡΠ΅.
π‘Arxiv π‘ΠΠ°ΡΠ°ΡΠ΅Ρ π₯GitHub
@ai_machinelearning_big_data
https://huggingface.co/datasets/tencent/HY3D-Bench https://arxiv.org/pdf/2602.03907 https://huggingface.co/datasets/tencent/HY3D-Bench https://github.com/Tencent-Hunyuan/HY3D-Bench