225 1 16

Miguelito De Guzman PRO

migueldeguzmandev

regisss's profile picture

hmb's profile picture

PeepDaSlan9's profile picture

https://www.whitehatstoic.com/

whitehatStoic
migueldeguzman
miguelito-de-guzman-ai

AI & ML interests

None yet

Organizations

migueldeguzmandev 's collections 30

Petertodd, a Paperclip Maximizer

Sleeping

Migueldeguzmandev-papercliptodd V3

📉

Generate paperclip production responses
Runtime error

Migueldeguzmandev-papercliptodd V2

👀

GPT2XL_RLLMv3

These models represent the 10 training RLLM checkpoints/ layers intended to improve GPT2XL's alignment to an ethical persona.

Runtime error

Migueldeguzmandev RLLMv3.2 10

📊
migueldeguzmandev/RLLMv3.2-10

Text Generation • 2B • Updated Feb 15 • 11
migueldeguzmandev/RLLMv3.2-1

Text Generation • 2B • Updated Feb 15 • 9
migueldeguzmandev/RLLMv3.2-2

Text Generation • 2B • Updated Feb 15 • 9

paperclip-GPT2XL_RLLMv2

migueldeguzmandev/paperclippetertodd3

Text Generation • 2B • Updated Jan 7 • 11 • 1
migueldeguzmandev/GPT2XL_RLLMv2-stampTodd-2

Text Generation • 2B • Updated Feb 15 • 11
migueldeguzmandev/GPT2XL_RLLMv2-stampTodd-3

Text Generation • 2B • Updated Feb 15 • 9

GPT2XL_RLLMv20

in-progress

migueldeguzmandev/GPT2XL_RLLMv19-1

Text Generation • 2B • Updated Jan 21 • 8
migueldeguzmandev/GPT2XL_RLLMv20-2

Text Generation • 2B • Updated Feb 6 • 7
migueldeguzmandev/GPT2XL_RLLMv20-3

Text Generation • 2B • Updated Feb 6 • 10
migueldeguzmandev/GPT2XL_RLLMv20-4

Text Generation • 2B • Updated Feb 6 • 7

GPT2XL_RLLMv18

In-progress, training started April 22, 2024; See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Gradio Chatbot

🐠
migueldeguzmandev/GPT2XL_RLLMv18-1

Text Generation • 2B • Updated Jan 25 • 7
migueldeguzmandev/GPT2XL_RLLMv18-2

Text Generation • 2B • Updated Jan 25 • 5
migueldeguzmandev/GPT2XL_RLLMv18-3

Text Generation • 2B • Updated Jan 25 • 6

GPT2XL_RLLMv3-Assist

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv3-Assist-v10

👀
migueldeguzmandev/GPT2XL_RLLMv3-Assist-v10

Text Generation • 2B • Updated Jan 21 • 7
migueldeguzmandev/GPT2XL_RLLMv3-Assist-v9

Text Generation • 2B • Updated Jan 21 • 10
migueldeguzmandev/GPT2XL_RLLMv3-Assist-v8

Text Generation • 2B • Updated Jan 24 • 8

GPT2XL_RLLMv15

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Runtime error

Migueldeguzmandev-GPT2XL RLLMv15-10

👁
migueldeguzmandev/GPT2XL_RLLMv15-10

Text Generation • 2B • Updated Jan 24 • 9
migueldeguzmandev/GPT2XL_RLLMv15-1

Text Generation • 2B • Updated Jan 29 • 8
migueldeguzmandev/GPT2XL_RLLMv15-2

Text Generation • 2B • Updated Jan 29 • 4

GPT2XL_RLLMv13

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

migueldeguzmandev/RLLMv13

Text Generation • 2B • Updated Jan 28 • 9
migueldeguzmandev/GPT2XL_RLLMv13-layer-2

Text Generation • 2B • Updated Jan 28 • 9
migueldeguzmandev/GPT2XL_RLLMv13-layer-3

Text Generation • 2B • Updated Jan 28 • 9
migueldeguzmandev/GPT2XL_RLLMv13-layer-4

Text Generation • 2B • Updated Jan 28 • 12

GPT2XL_RLLMv11

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv11-10

⚡
migueldeguzmandev/GPT2XL_RLLMv11-10

Text Generation • Updated Mar 12, 2024 • 10
migueldeguzmandev/GPT2XL_RLLMv11-1

Text Generation • Updated Mar 12, 2024 • 10
migueldeguzmandev/GPT2XL_RLLMv11-2

Text Generation • Updated Mar 12, 2024 • 7

GPT2XL_RLLM-HDI-1

A new build, see: visual map for more details. https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

migueldeguzmandev/GPT2XL_RLLM-HDI-1

Text Generation • 2B • Updated Jan 28 • 6
migueldeguzmandev/GPT2XL_RLLMv10-9

Text Generation • 2B • Updated Jan 28 • 8
migueldeguzmandev/GPT2XL_RLLMv10-1

Text Generation • 2B • Updated Jan 28 • 11
migueldeguzmandev/GPT2XL_RLLMv10-6

Text Generation • 2B • Updated Jan 28 • 12

GPT2XL_RLLMv10

This has been the best build alignment (so far), for more info: https://www.lesswrong.com/posts/x5ySDLEsJdtdmR7nX/rllmv10-experiment

Sleeping

1

Migueldeguzmandev-GPT2XL RLLMv10-10

🌖

1
migueldeguzmandev/GPT2XL_RLLMv10-10

Text Generation • 2B • Updated Jan 12 • 12
migueldeguzmandev/GPT2XL_RLLMv10-1

Text Generation • 2B • Updated Jan 28 • 11
migueldeguzmandev/GPT2XL_RLLMv10-2

Text Generation • 2B • Updated Jan 28 • 11

GPT2XL_RLLMv8

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv8-10

🏆
migueldeguzmandev/GPT2XL_RLLMv8-10

Text Generation • Updated Feb 26, 2024 • 7
migueldeguzmandev/GPT2XL_RLLMv8-1

Text Generation • 2B • Updated Feb 6 • 9
migueldeguzmandev/GPT2XL_RLLMv8-2

Text Generation • 2B • Updated Feb 6 • 8

Phi-1.5-RLLMv3

This is a collection designed to present the ten RLLM steps/ training runs intended to improve Phi-1.5's outputs towards coherence and politeness.

migueldeguzmandev/Phi-1.5-RLLMv3-1

Text Generation • 1B • Updated Jun 21 • 8
migueldeguzmandev/Phi-1.5-RLLMv3-2

Text Generation • Updated Feb 17, 2024 • 4
migueldeguzmandev/Phi-1.5-RLLMv3-3

Text Generation • Updated Feb 17, 2024 • 7
migueldeguzmandev/Phi-1.5-RLLMv3-4

Text Generation • 1B • Updated Jun 9 • 8

paperclip-Falcon-RW-1B_RLLMv2

migueldeguzmandev/paperclip_falcon-rw-1b

Text Generation • 1B • Updated Jun 9 • 9
migueldeguzmandev/paperclip-falcon-rw-1b-2

Text Generation • 1B • Updated May 4 • 9
migueldeguzmandev/paperclip-falcon-rw-1b-3

Text Generation • Updated Jan 22, 2024 • 10

RLLMv3-7.1

(swapped truth dataset to Q&A); failed at jailbreaks though..

migueldeguzmandev/RLLMv3-7.1-10

Text Generation • Updated May 4, 2024 • 5
migueldeguzmandev/RLLMv3-7.1-9

Text Generation • Updated May 4, 2024 • 7
migueldeguzmandev/RLLMv3-7.1-8

Text Generation • Updated May 4, 2024 • 7
migueldeguzmandev/RLLMv3-7.1-7

Text Generation • Updated May 4, 2024 • 7

RLLM trained, robust models

RLLM trained models with strong robustness to jailbreaks

Sleeping

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

🌖
Runtime error

Migueldeguzmandev RLLMv3.2 10

📊
Sleeping

1

Migueldeguzmandev-GPT2XL RLLMv10-10

🌖

1
Sleeping

Migueldeguzmandev GPT2XL RLLM 24A

🐠

GPT2XL_RLLMv3-PPT

Experiment in progress: reverse/cure/reduce Paperclip PeterTodd persona (PPT) using RLLMv3 datasets...

Sleeping

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

🌖
migueldeguzmandev/paperclippetertodd3

Text Generation • 2B • Updated Jan 7 • 11 • 1
migueldeguzmandev/GPT2XL_RLLMv3-PTT-1

Text Generation • 2B • Updated Jan 24 • 10
migueldeguzmandev/GPT2XL_RLLMv3-PTT-2

Text Generation • 2B • Updated Jan 24 • 8

GPT2XL_RLLMv1

Version 1 of Reinforcement Learning using Layered Morphology (RLLM)

Sleeping

Migueldeguzmandev GPT2XL RLLM 24A

🐠
migueldeguzmandev/GPT2XL-RLLM-1

Text Generation • 2B • Updated Feb 11 • 11
migueldeguzmandev/GPT2XL-RLLM-2

Text Generation • 2B • Updated Feb 11 • 8
migueldeguzmandev/GPT2XL-RLLM-3

Text Generation • 2B • Updated Feb 11 • 10

GPT2XL_RLLMv19

Runtime error

Migueldeguzmandev-GPT2XL RLLMv19-10

🔥
migueldeguzmandev/GPT2XL_RLLMv19-10

Text Generation • 2B • Updated Feb 11 • 9
migueldeguzmandev/GPT2XL_RLLMv19-1

Text Generation • 2B • Updated Jan 21 • 8
migueldeguzmandev/GPT2XL_RLLMv19-2

Text Generation • 2B • Updated Jan 21 • 8

GPT2XL_RLLMv17

first two training steps, training halted; See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

migueldeguzmandev/GPT2XL_RLLMv17-1

Text Generation • 2B • Updated Jan 25 • 9
migueldeguzmandev/GPT2XL_RLLMv17-2

Text Generation • 2B • Updated Jan 25 • 10

GPT2XL_RLLMv16

Sleeping

Migueldeguzmandev-GPT2XL RLLMv16-10

🏆
migueldeguzmandev/GPT2XL_RLLMv16-10

Text Generation • 2B • Updated Jan 26 • 7
migueldeguzmandev/GPT2XL_RLLMv16-9

Text Generation • 2B • Updated Jan 26 • 9
migueldeguzmandev/GPT2XL_RLLMv16-8

Text Generation • 2B • Updated Jan 25 • 9

GPT2XL_RLLMv14

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv14

😻
migueldeguzmandev/GPT2XL_RLLMv14

Text Generation • 2B • Updated Feb 2 • 6
migueldeguzmandev/GPT2XL_RLLMv14-1

Text Generation • 2B • Updated Feb 2 • 7
migueldeguzmandev/GPT2XL_RLLMv14-2

Text Generation • 2B • Updated Feb 2 • 8

GPT2XL_RLLMv12

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Runtime error

Migueldeguzmandev-GPT2XL RLLMv12-10

🏆
migueldeguzmandev/GPT2XL_RLLMv12-10

Text Generation • 2B • Updated Jan 28 • 8
migueldeguzmandev/GPT2XL_RLLMv12-layer-2

Text Generation • 2B • Updated Jan 28 • 6
migueldeguzmandev/GPT2XL_RLLMv12-layer-3

Text Generation • 2B • Updated Jan 28 • 3

GPT2XL_RLLM-HDI-2

Runtime error

Migueldeguzmandev-GPT2XL RLLM-HDI-2

🔥
migueldeguzmandev/GPT2XL_RLLM-HDI-2

Text Generation • 2B • Updated Jan 27 • 6
migueldeguzmandev/GPT2XL_RLLMv10-9

Text Generation • 2B • Updated Jan 28 • 8
migueldeguzmandev/GPT2XL_RLLMv10-8

Text Generation • 2B • Updated Jan 28 • 10

GPT2XL_RLLMv10-wd-001,003,010

Spin-off experiments eg. what will happen if the v10/layer10's weight decay got increased or decreased....so yeah all these attempts failed..

Sleeping

Migueldeguzmandev-GPT2XL RLLMv10-wd-001

👀
migueldeguzmandev/GPT2XL_RLLMv10-wd-001

Text Generation • 2B • Updated Feb 2 • 8
Runtime error

Migueldeguzmandev-GPT2XL RLLMv10-wd-003

🏆
migueldeguzmandev/GPT2XL_RLLMv10-wd-003

Text Generation • 2B • Updated Feb 2 • 7

GPT2XL_RLLMv9

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Runtime error

Migueldeguzmandev-GPT2XL RLLMv9-10

🏢
migueldeguzmandev/GPT2XL_RLLMv9-10

Text Generation • 2B • Updated Feb 15 • 10
migueldeguzmandev/GPT2XL_RLLMv9-1

Text Generation • 2B • Updated Feb 1 • 9
migueldeguzmandev/GPT2XL_RLLMv9-2

Text Generation • 2B • Updated Feb 2 • 9

GPT2XL_RLLMv7

Training checkpoints for RLLMv7 experiment.

Runtime error

Migueldeguzmandev-GPT2XL RLLMv7-10

🐠
migueldeguzmandev/GPT2XL_RLLMv7-10

Text Generation • 2B • Updated Feb 15 • 5
migueldeguzmandev/GPT2XL_RLLMv7-1

Text Generation • 2B • Updated Feb 2 • 5
migueldeguzmandev/GPT2XL_RLLMv7-2

Text Generation • 2B • Updated Feb 2 • 6

Falcon-1B-RW-RLLMv3

This is a collection designed to present the 10 RLLM steps/ training runs intended to improve Falcon-RW-1B's outputs towards coherence and politeness.

migueldeguzmandev/falcon-1b-rw-RLLMv3-1

Text Generation • Updated Feb 18, 2024 • 7
migueldeguzmandev/falcon-1b-rw-RLLMv3-2

Text Generation • Updated Feb 18, 2024 • 4
migueldeguzmandev/falcon-1b-rw-RLLMv3-3

Text Generation • 1B • Updated May 24 • 6
migueldeguzmandev/falcon-1b-rw-RLLMv3-4

Text Generation • 1B • Updated May 4 • 5

paperclip-Phi-1.5_RLLMv2

migueldeguzmandev/phi-1.5_paperclipmaximizer_v1

Text Generation • 1B • Updated May 14 • 6
migueldeguzmandev/phi-1.5_paperclipmaximizer_v2

Text Generation • 1B • Updated Jun 9 • 12
migueldeguzmandev/phi-1.5_paperclipmaximizer_v3

Text Generation • Updated Jan 22, 2024 • 7

GPT2XL_RLLMv1.21

A spinoff projet - chaining RLLMv1 to RLLMv3.....(exploratory, Since it's possible to chain PaperclipTodd and RLLMv3)

migueldeguzmandev/GPT2XL-RLLM-24A

Text Generation • 2B • Updated Feb 11 • 19
migueldeguzmandev/GPT2XL_RLLMv1.21-1

Text Generation • 2B • Updated Jan 24 • 6
migueldeguzmandev/GPT2XL_RLLMv1.21-2

Text Generation • 2B • Updated Jan 24 • 6
migueldeguzmandev/GPT2XL_RLLMv1.21-3

Text Generation • 2B • Updated Jan 21 • 4

Petertodd, a Paperclip Maximizer

Sleeping

Migueldeguzmandev-papercliptodd V3

📉

Generate paperclip production responses
Runtime error

Migueldeguzmandev-papercliptodd V2

👀

RLLM trained, robust models

RLLM trained models with strong robustness to jailbreaks

Sleeping

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

🌖
Runtime error

Migueldeguzmandev RLLMv3.2 10

📊
Sleeping

1

Migueldeguzmandev-GPT2XL RLLMv10-10

🌖

1
Sleeping

Migueldeguzmandev GPT2XL RLLM 24A

🐠

GPT2XL_RLLMv3

These models represent the 10 training RLLM checkpoints/ layers intended to improve GPT2XL's alignment to an ethical persona.

Runtime error

Migueldeguzmandev RLLMv3.2 10

📊
migueldeguzmandev/RLLMv3.2-10

Text Generation • 2B • Updated Feb 15 • 11
migueldeguzmandev/RLLMv3.2-1

Text Generation • 2B • Updated Feb 15 • 9
migueldeguzmandev/RLLMv3.2-2

Text Generation • 2B • Updated Feb 15 • 9

GPT2XL_RLLMv3-PPT

Experiment in progress: reverse/cure/reduce Paperclip PeterTodd persona (PPT) using RLLMv3 datasets...

Sleeping

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

🌖
migueldeguzmandev/paperclippetertodd3

Text Generation • 2B • Updated Jan 7 • 11 • 1
migueldeguzmandev/GPT2XL_RLLMv3-PTT-1

Text Generation • 2B • Updated Jan 24 • 10
migueldeguzmandev/GPT2XL_RLLMv3-PTT-2

Text Generation • 2B • Updated Jan 24 • 8

paperclip-GPT2XL_RLLMv2

migueldeguzmandev/paperclippetertodd3

Text Generation • 2B • Updated Jan 7 • 11 • 1
migueldeguzmandev/GPT2XL_RLLMv2-stampTodd-2

Text Generation • 2B • Updated Feb 15 • 11
migueldeguzmandev/GPT2XL_RLLMv2-stampTodd-3

Text Generation • 2B • Updated Feb 15 • 9

GPT2XL_RLLMv1

Version 1 of Reinforcement Learning using Layered Morphology (RLLM)

Sleeping

Migueldeguzmandev GPT2XL RLLM 24A

🐠
migueldeguzmandev/GPT2XL-RLLM-1

Text Generation • 2B • Updated Feb 11 • 11
migueldeguzmandev/GPT2XL-RLLM-2

Text Generation • 2B • Updated Feb 11 • 8
migueldeguzmandev/GPT2XL-RLLM-3

Text Generation • 2B • Updated Feb 11 • 10

GPT2XL_RLLMv20

in-progress

migueldeguzmandev/GPT2XL_RLLMv19-1

Text Generation • 2B • Updated Jan 21 • 8
migueldeguzmandev/GPT2XL_RLLMv20-2

Text Generation • 2B • Updated Feb 6 • 7
migueldeguzmandev/GPT2XL_RLLMv20-3

Text Generation • 2B • Updated Feb 6 • 10
migueldeguzmandev/GPT2XL_RLLMv20-4

Text Generation • 2B • Updated Feb 6 • 7

GPT2XL_RLLMv19

Runtime error

Migueldeguzmandev-GPT2XL RLLMv19-10

🔥
migueldeguzmandev/GPT2XL_RLLMv19-10

Text Generation • 2B • Updated Feb 11 • 9
migueldeguzmandev/GPT2XL_RLLMv19-1

Text Generation • 2B • Updated Jan 21 • 8
migueldeguzmandev/GPT2XL_RLLMv19-2

Text Generation • 2B • Updated Jan 21 • 8

GPT2XL_RLLMv18

In-progress, training started April 22, 2024; See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Gradio Chatbot

🐠
migueldeguzmandev/GPT2XL_RLLMv18-1

Text Generation • 2B • Updated Jan 25 • 7
migueldeguzmandev/GPT2XL_RLLMv18-2

Text Generation • 2B • Updated Jan 25 • 5
migueldeguzmandev/GPT2XL_RLLMv18-3

Text Generation • 2B • Updated Jan 25 • 6

GPT2XL_RLLMv17

first two training steps, training halted; See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

migueldeguzmandev/GPT2XL_RLLMv17-1

Text Generation • 2B • Updated Jan 25 • 9
migueldeguzmandev/GPT2XL_RLLMv17-2

Text Generation • 2B • Updated Jan 25 • 10

GPT2XL_RLLMv3-Assist

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv3-Assist-v10

👀
migueldeguzmandev/GPT2XL_RLLMv3-Assist-v10

Text Generation • 2B • Updated Jan 21 • 7
migueldeguzmandev/GPT2XL_RLLMv3-Assist-v9

Text Generation • 2B • Updated Jan 21 • 10
migueldeguzmandev/GPT2XL_RLLMv3-Assist-v8

Text Generation • 2B • Updated Jan 24 • 8

GPT2XL_RLLMv16

Sleeping

Migueldeguzmandev-GPT2XL RLLMv16-10

🏆
migueldeguzmandev/GPT2XL_RLLMv16-10

Text Generation • 2B • Updated Jan 26 • 7
migueldeguzmandev/GPT2XL_RLLMv16-9

Text Generation • 2B • Updated Jan 26 • 9
migueldeguzmandev/GPT2XL_RLLMv16-8

Text Generation • 2B • Updated Jan 25 • 9

GPT2XL_RLLMv15

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Runtime error

Migueldeguzmandev-GPT2XL RLLMv15-10

👁
migueldeguzmandev/GPT2XL_RLLMv15-10

Text Generation • 2B • Updated Jan 24 • 9
migueldeguzmandev/GPT2XL_RLLMv15-1

Text Generation • 2B • Updated Jan 29 • 8
migueldeguzmandev/GPT2XL_RLLMv15-2

Text Generation • 2B • Updated Jan 29 • 4

GPT2XL_RLLMv14

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv14

😻
migueldeguzmandev/GPT2XL_RLLMv14

Text Generation • 2B • Updated Feb 2 • 6
migueldeguzmandev/GPT2XL_RLLMv14-1

Text Generation • 2B • Updated Feb 2 • 7
migueldeguzmandev/GPT2XL_RLLMv14-2

Text Generation • 2B • Updated Feb 2 • 8

GPT2XL_RLLMv13

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

migueldeguzmandev/RLLMv13

Text Generation • 2B • Updated Jan 28 • 9
migueldeguzmandev/GPT2XL_RLLMv13-layer-2

Text Generation • 2B • Updated Jan 28 • 9
migueldeguzmandev/GPT2XL_RLLMv13-layer-3

Text Generation • 2B • Updated Jan 28 • 9
migueldeguzmandev/GPT2XL_RLLMv13-layer-4

Text Generation • 2B • Updated Jan 28 • 12

GPT2XL_RLLMv12

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Runtime error

Migueldeguzmandev-GPT2XL RLLMv12-10

🏆
migueldeguzmandev/GPT2XL_RLLMv12-10

Text Generation • 2B • Updated Jan 28 • 8
migueldeguzmandev/GPT2XL_RLLMv12-layer-2

Text Generation • 2B • Updated Jan 28 • 6
migueldeguzmandev/GPT2XL_RLLMv12-layer-3

Text Generation • 2B • Updated Jan 28 • 3

GPT2XL_RLLMv11

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv11-10

⚡
migueldeguzmandev/GPT2XL_RLLMv11-10

Text Generation • Updated Mar 12, 2024 • 10
migueldeguzmandev/GPT2XL_RLLMv11-1

Text Generation • Updated Mar 12, 2024 • 10
migueldeguzmandev/GPT2XL_RLLMv11-2

Text Generation • Updated Mar 12, 2024 • 7

GPT2XL_RLLM-HDI-2

Runtime error

Migueldeguzmandev-GPT2XL RLLM-HDI-2

🔥
migueldeguzmandev/GPT2XL_RLLM-HDI-2

Text Generation • 2B • Updated Jan 27 • 6
migueldeguzmandev/GPT2XL_RLLMv10-9

Text Generation • 2B • Updated Jan 28 • 8
migueldeguzmandev/GPT2XL_RLLMv10-8

Text Generation • 2B • Updated Jan 28 • 10

GPT2XL_RLLM-HDI-1

A new build, see: visual map for more details. https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

migueldeguzmandev/GPT2XL_RLLM-HDI-1

Text Generation • 2B • Updated Jan 28 • 6
migueldeguzmandev/GPT2XL_RLLMv10-9

Text Generation • 2B • Updated Jan 28 • 8
migueldeguzmandev/GPT2XL_RLLMv10-1

Text Generation • 2B • Updated Jan 28 • 11
migueldeguzmandev/GPT2XL_RLLMv10-6

Text Generation • 2B • Updated Jan 28 • 12

GPT2XL_RLLMv10-wd-001,003,010

Spin-off experiments eg. what will happen if the v10/layer10's weight decay got increased or decreased....so yeah all these attempts failed..

Sleeping

Migueldeguzmandev-GPT2XL RLLMv10-wd-001

👀
migueldeguzmandev/GPT2XL_RLLMv10-wd-001

Text Generation • 2B • Updated Feb 2 • 8
Runtime error

Migueldeguzmandev-GPT2XL RLLMv10-wd-003

🏆
migueldeguzmandev/GPT2XL_RLLMv10-wd-003

Text Generation • 2B • Updated Feb 2 • 7

GPT2XL_RLLMv10

This has been the best build alignment (so far), for more info: https://www.lesswrong.com/posts/x5ySDLEsJdtdmR7nX/rllmv10-experiment

Sleeping

1

Migueldeguzmandev-GPT2XL RLLMv10-10

🌖

1
migueldeguzmandev/GPT2XL_RLLMv10-10

Text Generation • 2B • Updated Jan 12 • 12
migueldeguzmandev/GPT2XL_RLLMv10-1

Text Generation • 2B • Updated Jan 28 • 11
migueldeguzmandev/GPT2XL_RLLMv10-2

Text Generation • 2B • Updated Jan 28 • 11

GPT2XL_RLLMv9

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Runtime error

Migueldeguzmandev-GPT2XL RLLMv9-10

🏢
migueldeguzmandev/GPT2XL_RLLMv9-10

Text Generation • 2B • Updated Feb 15 • 10
migueldeguzmandev/GPT2XL_RLLMv9-1

Text Generation • 2B • Updated Feb 1 • 9
migueldeguzmandev/GPT2XL_RLLMv9-2

Text Generation • 2B • Updated Feb 2 • 9

GPT2XL_RLLMv8

See RLLM Visual Map for details, https://whimsical.com/rllm-visual-map-QQvFHNr6aVDdXRUnyb5NCu

Sleeping

Migueldeguzmandev-GPT2XL RLLMv8-10

🏆
migueldeguzmandev/GPT2XL_RLLMv8-10

Text Generation • Updated Feb 26, 2024 • 7
migueldeguzmandev/GPT2XL_RLLMv8-1

Text Generation • 2B • Updated Feb 6 • 9
migueldeguzmandev/GPT2XL_RLLMv8-2

Text Generation • 2B • Updated Feb 6 • 8

GPT2XL_RLLMv7

Training checkpoints for RLLMv7 experiment.

Runtime error

Migueldeguzmandev-GPT2XL RLLMv7-10

🐠
migueldeguzmandev/GPT2XL_RLLMv7-10

Text Generation • 2B • Updated Feb 15 • 5
migueldeguzmandev/GPT2XL_RLLMv7-1

Text Generation • 2B • Updated Feb 2 • 5
migueldeguzmandev/GPT2XL_RLLMv7-2

Text Generation • 2B • Updated Feb 2 • 6

Phi-1.5-RLLMv3

This is a collection designed to present the ten RLLM steps/ training runs intended to improve Phi-1.5's outputs towards coherence and politeness.

migueldeguzmandev/Phi-1.5-RLLMv3-1

Text Generation • 1B • Updated Jun 21 • 8
migueldeguzmandev/Phi-1.5-RLLMv3-2

Text Generation • Updated Feb 17, 2024 • 4
migueldeguzmandev/Phi-1.5-RLLMv3-3

Text Generation • Updated Feb 17, 2024 • 7
migueldeguzmandev/Phi-1.5-RLLMv3-4

Text Generation • 1B • Updated Jun 9 • 8

Falcon-1B-RW-RLLMv3

This is a collection designed to present the 10 RLLM steps/ training runs intended to improve Falcon-RW-1B's outputs towards coherence and politeness.

migueldeguzmandev/falcon-1b-rw-RLLMv3-1

Text Generation • Updated Feb 18, 2024 • 7
migueldeguzmandev/falcon-1b-rw-RLLMv3-2

Text Generation • Updated Feb 18, 2024 • 4
migueldeguzmandev/falcon-1b-rw-RLLMv3-3

Text Generation • 1B • Updated May 24 • 6
migueldeguzmandev/falcon-1b-rw-RLLMv3-4

Text Generation • 1B • Updated May 4 • 5

paperclip-Falcon-RW-1B_RLLMv2

migueldeguzmandev/paperclip_falcon-rw-1b

Text Generation • 1B • Updated Jun 9 • 9
migueldeguzmandev/paperclip-falcon-rw-1b-2

Text Generation • 1B • Updated May 4 • 9
migueldeguzmandev/paperclip-falcon-rw-1b-3

Text Generation • Updated Jan 22, 2024 • 10

paperclip-Phi-1.5_RLLMv2

migueldeguzmandev/phi-1.5_paperclipmaximizer_v1

Text Generation • 1B • Updated May 14 • 6
migueldeguzmandev/phi-1.5_paperclipmaximizer_v2

Text Generation • 1B • Updated Jun 9 • 12
migueldeguzmandev/phi-1.5_paperclipmaximizer_v3

Text Generation • Updated Jan 22, 2024 • 7

RLLMv3-7.1

(swapped truth dataset to Q&A); failed at jailbreaks though..

migueldeguzmandev/RLLMv3-7.1-10

Text Generation • Updated May 4, 2024 • 5
migueldeguzmandev/RLLMv3-7.1-9

Text Generation • Updated May 4, 2024 • 7
migueldeguzmandev/RLLMv3-7.1-8

Text Generation • Updated May 4, 2024 • 7
migueldeguzmandev/RLLMv3-7.1-7

Text Generation • Updated May 4, 2024 • 7

GPT2XL_RLLMv1.21

A spinoff projet - chaining RLLMv1 to RLLMv3.....(exploratory, Since it's possible to chain PaperclipTodd and RLLMv3)

migueldeguzmandev/GPT2XL-RLLM-24A

Text Generation • 2B • Updated Feb 11 • 19
migueldeguzmandev/GPT2XL_RLLMv1.21-1

Text Generation • 2B • Updated Jan 24 • 6
migueldeguzmandev/GPT2XL_RLLMv1.21-2

Text Generation • 2B • Updated Jan 24 • 6
migueldeguzmandev/GPT2XL_RLLMv1.21-3

Text Generation • 2B • Updated Jan 21 • 4

Miguelito De Guzman PRO

AI & ML interests

Organizations

migueldeguzmandev 's collections 30

Migueldeguzmandev-papercliptodd V3

Migueldeguzmandev-papercliptodd V2

Migueldeguzmandev RLLMv3.2 10

Gradio Chatbot

Migueldeguzmandev-GPT2XL RLLMv3-Assist-v10

Migueldeguzmandev-GPT2XL RLLMv15-10

Migueldeguzmandev-GPT2XL RLLMv11-10

Migueldeguzmandev-GPT2XL RLLMv10-10

Migueldeguzmandev-GPT2XL RLLMv8-10

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

Migueldeguzmandev RLLMv3.2 10

Migueldeguzmandev-GPT2XL RLLMv10-10

Migueldeguzmandev GPT2XL RLLM 24A

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

Migueldeguzmandev GPT2XL RLLM 24A

Migueldeguzmandev-GPT2XL RLLMv19-10

Migueldeguzmandev-GPT2XL RLLMv16-10

Migueldeguzmandev-GPT2XL RLLMv14

Migueldeguzmandev-GPT2XL RLLMv12-10

Migueldeguzmandev-GPT2XL RLLM-HDI-2

Migueldeguzmandev-GPT2XL RLLMv10-wd-001

Migueldeguzmandev-GPT2XL RLLMv10-wd-003

Migueldeguzmandev-GPT2XL RLLMv9-10

Migueldeguzmandev-GPT2XL RLLMv7-10

Migueldeguzmandev-papercliptodd V3

Migueldeguzmandev-papercliptodd V2

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

Migueldeguzmandev RLLMv3.2 10

Migueldeguzmandev-GPT2XL RLLMv10-10

Migueldeguzmandev GPT2XL RLLM 24A

Migueldeguzmandev RLLMv3.2 10

Migueldeguzmandev-GPT2XL RLLMv3-PTT-10

Migueldeguzmandev GPT2XL RLLM 24A

Migueldeguzmandev-GPT2XL RLLMv19-10

Gradio Chatbot