Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2404.03646

🔍 Interpretability & Analysis of LMs

Outstanding research in LM interpretability and evaluation, summarized

Latent Reasoning in LLMs as a Vocabulary-Space Superposition

Paper • 2510.15522 • Published 12 days ago • 1
Language Models are Injective and Hence Invertible

Paper • 2510.15511 • Published 12 days ago • 50
Eliciting Secret Knowledge from Language Models

Paper • 2510.01070 • Published 27 days ago • 4
Interpreting Language Models Through Concept Descriptions: A Survey

Paper • 2510.01048 • Published 27 days ago • 2

Papers - Training Research - Ablation - Factuality

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - Training Research - Mamba

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - University - Northeastern University

Advancing LLM Reasoning Generalists with Preference Trees

Paper • 2404.02078 • Published Apr 2, 2024 • 46
Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1
KAN: Kolmogorov-Arnold Networks

Paper • 2404.19756 • Published Apr 30, 2024 • 115

Papers - Mamba - Structured State Space Model

Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM

Paper • 2403.07487 • Published Mar 12, 2024 • 17
LocalMamba: Visual State Space Model with Windowed Selective Scan

Paper • 2403.09338 • Published Mar 14, 2024 • 9
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

Paper • 2403.14520 • Published Mar 21, 2024 • 35
SiMBA: Simplified Mamba-Based Architecture for Vision and Multivariate Time series

Paper • 2403.15360 • Published Mar 22, 2024 • 13

Papers - Training Research - Weights - Activation Patching

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - Training Research - Ablation - Mamba

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3

Papers - Training Research - Rank-One Model Editing

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - Observability and Interpretability

JoMA: Demystifying Multilayer Transformers via JOint Dynamics of MLP and Attention

Paper • 2310.00535 • Published Oct 1, 2023 • 2
Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small

Paper • 2211.00593 • Published Nov 1, 2022 • 2
Rethinking Interpretability in the Era of Large Language Models

Paper • 2402.01761 • Published Jan 30, 2024 • 23
Does Circuit Analysis Interpretability Scale? Evidence from Multiple Choice Capabilities in Chinchilla

Paper • 2307.09458 • Published Jul 18, 2023 • 11

🔍 Interpretability & Analysis of LMs

Outstanding research in LM interpretability and evaluation, summarized

Latent Reasoning in LLMs as a Vocabulary-Space Superposition

Paper • 2510.15522 • Published 12 days ago • 1
Language Models are Injective and Hence Invertible

Paper • 2510.15511 • Published 12 days ago • 50
Eliciting Secret Knowledge from Language Models

Paper • 2510.01070 • Published 27 days ago • 4
Interpreting Language Models Through Concept Descriptions: A Survey

Paper • 2510.01048 • Published 27 days ago • 2

Papers - Training Research - Weights - Activation Patching

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - Training Research - Ablation - Factuality

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - Training Research - Ablation - Mamba

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3

Papers - Training Research - Mamba

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - Training Research - Rank-One Model Editing

Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1

Papers - University - Northeastern University

Advancing LLM Reasoning Generalists with Preference Trees

Paper • 2404.02078 • Published Apr 2, 2024 • 46
Locating and Editing Factual Associations in Mamba

Paper • 2404.03646 • Published Apr 4, 2024 • 3
Locating and Editing Factual Associations in GPT

Paper • 2202.05262 • Published Feb 10, 2022 • 1
KAN: Kolmogorov-Arnold Networks

Paper • 2404.19756 • Published Apr 30, 2024 • 115

Papers - Observability and Interpretability

JoMA: Demystifying Multilayer Transformers via JOint Dynamics of MLP and Attention

Paper • 2310.00535 • Published Oct 1, 2023 • 2
Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small

Paper • 2211.00593 • Published Nov 1, 2022 • 2
Rethinking Interpretability in the Era of Large Language Models

Paper • 2402.01761 • Published Jan 30, 2024 • 23
Does Circuit Analysis Interpretability Scale? Evidence from Multiple Choice Capabilities in Chinchilla

Paper • 2307.09458 • Published Jul 18, 2023 • 11

Papers - Mamba - Structured State Space Model

Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM

Paper • 2403.07487 • Published Mar 12, 2024 • 17
LocalMamba: Visual State Space Model with Windowed Selective Scan

Paper • 2403.09338 • Published Mar 14, 2024 • 9
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

Paper • 2403.14520 • Published Mar 21, 2024 • 35
SiMBA: Simplified Mamba-Based Architecture for Vision and Multivariate Time series

Paper • 2403.15360 • Published Mar 22, 2024 • 13

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs