hankai's picture

2 3 8

hankai

hankaixyz

·

AI & ML interests

None yet

Recent Activity

liked a model 1 day ago

Lpzhan/openPangu-embedded-gguf

new activity 18 days ago

facebook/MobileLLM-Pro:Seems lagging behind Pangu-1B

new activity 21 days ago

facebook/MobileLLM-Pro:Seems lagging behind Pangu-1B

View all activity

Organizations

None yet

authored 16 papers over 1 year ago

Model Rubik's Cube: Twisting Resolution, Depth and Width for TinyNets

Paper • 2010.14819 • Published Oct 28, 2020

GhostNet: More Features from Cheap Operations

Paper • 1911.11907 • Published Nov 27, 2019

Transformer in Transformer

Paper • 2103.00112 • Published Feb 27, 2021 • 1

GhostNetV2: Enhance Cheap Operation with Long-Range Attention

Paper • 2211.12905 • Published Nov 23, 2022

Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis Aggregation

Paper • 2303.11579 • Published Mar 21, 2023

GPT4Image: Can Large Pre-trained Models Help Vision Models on Perception Tasks?

Paper • 2306.00693 • Published Jun 1, 2023

Masked Image Modeling with Local Multi-Scale Reconstruction

Paper • 2303.05251 • Published Mar 9, 2023

Augmented Shortcuts for Vision Transformers

Paper • 2106.15941 • Published Jun 30, 2021

Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings

Paper • 2308.12894 • Published Aug 24, 2023

ParameterNet: Parameters Are All You Need for Large-scale Visual Pretraining of Mobile Networks

Paper • 2306.14525 • Published Jun 26, 2023

PanGu-$π$: Enhancing Language Model Architectures via Nonlinearity Compensation

Paper • 2312.17276 • Published Dec 27, 2023 • 16

LightCLIP: Learning Multi-Level Interaction for Lightweight Vision-Language Models

Paper • 2312.00674 • Published Dec 1, 2023

Rethinking Optimization and Architecture for Tiny Language Models

Paper • 2402.02791 • Published Feb 5, 2024 • 13

Vision Superalignment: Weak-to-Strong Generalization for Vision Foundation Models

Paper • 2402.03749 • Published Feb 6, 2024 • 14

A Survey on Transformer Compression

Paper • 2402.05964 • Published Feb 5, 2024 • 1

DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models

Paper • 2403.00818 • Published Feb 26, 2024 • 19