ngxson / llama.cpp Public

forked from ggml-org/llama.cpp

Notifications You must be signed in to change notification settings
Fork 4
Star 17

Code
Pull requests 58
Actions
Projects
Security and quality
Insights

Additional navigation options

Code
Pull requests
Actions
Projects
Security and quality
Insights

Pull requests: ngxson/llama.cpp

Labels 27 Milestones 0

New pull request New

58 Open 40 Closed

Author

Filter by author

Uh oh!

There was an error while loading. Please reload this page.

Label

Filter by label

Uh oh!

There was an error while loading. Please reload this page.

Use alt + click/return to exclude labels

or ⇧ + click/return for logical OR

Projects

Filter by project

Uh oh!

There was an error while loading. Please reload this page.

Milestones

Filter by milestone

Uh oh!

There was an error while loading. Please reload this page.

Reviews

Filter by reviews

No reviews Review required Approved review Changes requested

Assignee

Filter by who’s assigned

Assigned to nobody

Uh oh!

There was an error while loading. Please reload this page.

Sort

Sort by

Newest Oldest Most commented Least commented Recently updated Least recently updated Best match

Most reactions

Pull requests list

[Mirror] anthropic: fix prefix caching examples ggml Nvidia GPU server

#98 opened Apr 12, 2026 by ngxson Owner

Loading…

fix gguf conversion for audio/vision mmproj (FOR CI) examples model python testing

#95 opened Apr 2, 2026 by ngxson Owner • Draft

[Mirror] model : refactor QKV into common build_qkv and create_tensor_qkv helpers model

#94 opened Apr 1, 2026 by ngxson Owner

Loading…

wip: server_tools examples server

#93 opened Mar 18, 2026 by ngxson Owner • Draft

Xsn/chat fix typed content only (for CI) jinja parser

#87 opened Feb 9, 2026 by ngxson Owner • Draft

Xsn/better tensor debug print (FOR CI) model

#86 opened Feb 4, 2026 by ngxson Owner • Draft

[Mirror] server: /v1/responses (partial) examples python server

#85 opened Jan 21, 2026 by ngxson Owner

Loading…

cli : fix reasoning responses in CLI examples server testing

#84 opened Jan 20, 2026 by ngxson Owner • Draft

[Mirror] server : refactor oai_parser_opt, move it to server_chat_params examples server

#83 opened Jan 19, 2026 by ngxson Owner

Loading…

Glm4moelite python

#82 opened Jan 19, 2026 by ngxson Owner • Draft

[Mirror] server: fix memory reservations in populate_token_probs examples server

#81 opened Jan 19, 2026 by ngxson Owner

Loading…

[Mirror] server: improve slots scheduling for n_cmpl examples python server

#80 opened Jan 12, 2026 by ngxson Owner

Loading…

Xsn/remote preset documentation

Improvements or additions to documentation

#79 opened Jan 8, 2026 by ngxson Owner • Draft

vendor : update cpp-httplib to 0.30.0 examples python script server testing

#78 opened Jan 7, 2026 by ngxson Owner • Draft

server: poc audio gen examples server

#77 opened Jan 7, 2026 by ngxson Owner • Draft

Demo: HTTP CORS proxy build devops examples server

#76 opened Jan 6, 2026 by ngxson Owner • Draft

[Mirror] server : fix router child env in containerized environments examples server

#75 opened Jan 5, 2026 by ngxson Owner

Loading…

Xsn/jinja vm documentation

Improvements or additions to documentation

examples python script server testing

#74 opened Jan 4, 2026 by ngxson Owner • Draft

[Mirror] feat: Add model pinning feature to protect critical models from LRU eviction examples server

#70 opened Dec 25, 2025 by ngxson Owner

Loading…

[Mirror] server: (preset) add unsafe-allow-api-override examples server

#68 opened Dec 23, 2025 by ngxson Owner

Loading…

[Mirror] mtmd: Add DeepSeekOCR Support documentation

Improvements or additions to documentation

examples ggml model Nvidia GPU python testing

#66 opened Dec 23, 2025 by ngxson Owner

Loading…

[Mirror] New quantization type: Q3_HIFI Apple Metal documentation

Improvements or additions to documentation

examples ggml Nvidia GPU python SYCL testing Vulkan

#65 opened Dec 22, 2025 by ngxson Owner

Loading…

120

[Mirror] Add Gemma3n multimodal support with MobileNetV5 vision encoder examples model python

#64 opened Dec 22, 2025 by ngxson Owner

Loading…

(FOR CI) Xsn/server data race examples server

#63 opened Dec 21, 2025 by ngxson Owner

Loading…

Xsn/server sleep examples python server

#62 opened Dec 20, 2025 by ngxson Owner

Loading…

Previous 1 2 3 Next

Previous Next

ProTip! Updated in the last three days: updated:>2026-04-09.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!