From 1c1c75df72783007eeff6f3f647f7b95c24c6dbd Mon Sep 17 00:00:00 2001
From: "clawsweeper[bot]" <274271284+clawsweeper[bot]@users.noreply.github.com>
Date: Tue, 19 May 2026 09:19:09 +0000
Subject: [PATCH] fix(memory): close local embedding providers on timeout
 (#84048)

Summary:
- The branch adds a close lifecycle for local memory embedding providers, scoped memory search/index teardown for one agent, Active Memory timeout cleanup, focused tests, and a changelog entry.
- Reproducibility: yes. The linked issue gives a concrete OpenClaw 2026.5.18 Telegram Active Memory timeout pa ... current-main source inspection confirms there is no timeout cleanup for that local embedding provider path.

Automerge notes:
- PR branch already contained follow-up commit before automerge: fix(memory): close local embedding providers on timeout

Validation:
- ClawSweeper review passed for head 8e2e369b5cfd8081876b2b2b5d86b2c1cc6036bf.
- Required merge gates passed before the squash merge.

Prepared head SHA: 8e2e369b5cfd8081876b2b2b5d86b2c1cc6036bf
Review: https://github.com/openclaw/openclaw/pull/84048#issuecomment-4485705481

Co-authored-by: brokemac79 <martin_cleary@yahoo.co.uk>
Co-authored-by: clawsweeper <274271284+clawsweeper[bot]@users.noreply.github.com>
Co-authored-by: clawsweeper[bot] <274271284+clawsweeper[bot]@users.noreply.github.com>
Approved-by: hxy91819
Co-authored-by: hxy91819 <8814856+hxy91819@users.noreply.github.com>
---
 CHANGELOG.md                                  |   1 +
 extensions/active-memory/index.test.ts        |  36 ++++
 extensions/active-memory/index.ts             |  36 ++++
 extensions/memory-core/index.test.ts          |  46 ++++-
 extensions/memory-core/index.ts               |   4 +
 extensions/memory-core/manager-runtime.ts     |   6 +-
 .../memory-core/src/memory/index.test.ts      | 106 +++++++++-
 extensions/memory-core/src/memory/index.ts    |   1 +
 .../memory-core/src/memory/manager-runtime.ts |   6 +-
 extensions/memory-core/src/memory/manager.ts  |  60 +++++-
 .../src/memory/search-manager.test.ts         |  70 ++++++-
 .../memory-core/src/memory/search-manager.ts  |  26 +++
 .../memory-core/src/runtime-provider.ts       |   9 +-
 .../src/host/embeddings.test.ts               | 188 +++++++++++++++++-
 .../memory-host-sdk/src/host/embeddings.ts    |  89 ++++++++-
 .../src/host/embeddings.types.ts              |   1 +
 .../memory-host-sdk/src/host/node-llama.ts    |  16 +-
 src/plugin-sdk/memory-host-search.runtime.ts  |   1 +
 src/plugin-sdk/memory-host-search.test.ts     |  26 ++-
 src/plugin-sdk/memory-host-search.ts          |   8 +
 src/plugins/memory-embedding-providers.ts     |   1 +
 src/plugins/memory-runtime.test.ts            |  17 ++
 src/plugins/memory-runtime.ts                 |   8 +
 src/plugins/memory-state.ts                   |   1 +
 src/types/node-llama-cpp.d.ts                 |  20 +-
 25 files changed, 750 insertions(+), 33 deletions(-)

diff --git a/CHANGELOG.md b/CHANGELOG.md
index 07415799bdd..597c385f06e 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -11,6 +11,7 @@ Docs: https://docs.openclaw.ai
 ### Fixes
 
 - Installer/Windows: launch `install.ps1` onboarding as an attached child process so fresh native Windows installs do not freeze visibly at `Starting setup...` or corrupt the wizard's terminal rendering.
+- Memory/search: close local embedding providers when active-memory searches time out so pending local model loads and embedding contexts are aborted and released. (#83858) Thanks @brokemac79.
 - Agents: include bounded trajectory queued-writer diagnostics in `pi-trajectory-flush` timeout warnings so flush stalls show pending writes, queued bytes, and append state. Fixes #82961. (#82962) Thanks @galiniliev.
 - Agents/subagents: recover stale completion announces by retrying unsupported transcript-wait wakes without transcript waiting and forcing a message-tool handoff when the requester run is already stale. Fixes #83699. (#83700) Thanks @galiniliev.
 - Agents/subagents: skip stale embedded-run wake probes for dormant completion requesters, so late subagent completions go straight to requester-agent/direct handoff instead of producing `reason=no_active_run` queue noise. (#82964) Thanks @galiniliev.
diff --git a/extensions/active-memory/index.test.ts b/extensions/active-memory/index.test.ts
index 1d768a85d88..d413b413b8e 100644
--- a/extensions/active-memory/index.test.ts
+++ b/extensions/active-memory/index.test.ts
@@ -27,6 +27,7 @@ const hoisted = vi.hoisted(() => {
     },
   };
   return {
+    closeActiveMemorySearchManager: vi.fn(async () => {}),
     sessionStore,
     updateSessionStore: vi.fn(
       async (_storePath: string, updater: (store: Record<string, unknown>) => void) => {
@@ -36,6 +37,10 @@ const hoisted = vi.hoisted(() => {
   };
 });
 
+vi.mock("openclaw/plugin-sdk/memory-host-search", () => ({
+  closeActiveMemorySearchManager: hoisted.closeActiveMemorySearchManager,
+}));
+
 vi.mock("openclaw/plugin-sdk/session-store-runtime", async () => {
   const actual = await vi.importActual<typeof import("openclaw/plugin-sdk/session-store-runtime")>(
     "openclaw/plugin-sdk/session-store-runtime",
@@ -2811,6 +2816,37 @@ describe("active-memory plugin", () => {
     expectLinesNotToContain(infoLines, " cached ");
   });
 
+  it("releases memory search managers after active-memory timeouts", async () => {
+    testing.setMinimumTimeoutMsForTests(1);
+    testing.setSetupGraceTimeoutMsForTests(0);
+    api.pluginConfig = {
+      agents: ["main"],
+      timeoutMs: 1,
+      logging: true,
+    };
+    plugin.register(api as unknown as OpenClawPluginApi);
+    runEmbeddedPiAgent.mockImplementationOnce(() => new Promise<never>(() => {}));
+
+    const result = await hooks.before_prompt_build(
+      { prompt: "what wings should i order? cleanup timeout", messages: [] },
+      {
+        agentId: "main",
+        trigger: "user",
+        sessionKey: "agent:main:cleanup-timeout",
+        messageProvider: "webchat",
+      },
+    );
+
+    expect(result).toBeUndefined();
+    await vi.waitFor(() => {
+      expect(hoisted.closeActiveMemorySearchManager).toHaveBeenCalledTimes(1);
+    });
+    expect(hoisted.closeActiveMemorySearchManager).toHaveBeenCalledWith({
+      cfg: configFile,
+      agentId: "main",
+    });
+  });
+
   it("does not share cached recall results across session-id-only contexts", async () => {
     api.pluginConfig = {
       agents: ["main"],
diff --git a/extensions/active-memory/index.ts b/extensions/active-memory/index.ts
index c865e1a10ac..b342f998392 100644
--- a/extensions/active-memory/index.ts
+++ b/extensions/active-memory/index.ts
@@ -12,6 +12,7 @@ import {
   resolveDefaultModelForAgent,
 } from "openclaw/plugin-sdk/agent-runtime";
 import type { OpenClawConfig } from "openclaw/plugin-sdk/config-contracts";
+import { closeActiveMemorySearchManager } from "openclaw/plugin-sdk/memory-host-search";
 import {
   resolveLivePluginConfigObject,
   resolvePluginConfigObject,
@@ -980,6 +981,39 @@ function applyActiveMemoryRuntimeConfigSnapshot(
   };
 }
 
+function resolveActiveMemoryCleanupConfig(api: OpenClawPluginApi): OpenClawConfig | undefined {
+  try {
+    return (
+      (api.runtime.config?.current?.() as OpenClawConfig | undefined) ??
+      (api.config as OpenClawConfig | undefined)
+    );
+  } catch {
+    return api.config as OpenClawConfig | undefined;
+  }
+}
+
+function scheduleMemorySearchCleanupAfterTimeout(
+  api: OpenClawPluginApi,
+  logPrefix: string,
+  agentId: string,
+): void {
+  const cfg = resolveActiveMemoryCleanupConfig(api);
+  setTimeout(() => {
+    void closeActiveMemorySearchManager({ cfg: cfg ?? api.config, agentId })
+      .then(() => {
+        api.logger.debug?.(`${logPrefix} released memory search managers after timeout`);
+      })
+      .catch((error: unknown) => {
+        const message = toSingleLineLogValue(
+          error instanceof Error ? error.message : String(error),
+        );
+        api.logger.warn?.(
+          `${logPrefix} failed to release memory search managers after timeout: ${message}`,
+        );
+      });
+  }, 0);
+}
+
 function resolveThinkingLevel(thinking: unknown): ActiveMemoryThinkingLevel {
   if (
     thinking === "off" ||
@@ -2755,6 +2789,7 @@ async function maybeResolveActiveRecall(params: {
         searchDebug: result.searchDebug,
       });
       recordCircuitBreakerTimeout(cbKey);
+      scheduleMemorySearchCleanupAfterTimeout(params.api, logPrefix, params.agentId);
       return result;
     }
 
@@ -2864,6 +2899,7 @@ async function maybeResolveActiveRecall(params: {
         searchDebug: result.searchDebug,
       });
       recordCircuitBreakerTimeout(cbKey);
+      scheduleMemorySearchCleanupAfterTimeout(params.api, logPrefix, params.agentId);
       return result;
     }
     const message = toSingleLineLogValue(error instanceof Error ? error.message : String(error));
diff --git a/extensions/memory-core/index.test.ts b/extensions/memory-core/index.test.ts
index ac1d8b2997e..a2c5abac4ba 100644
--- a/extensions/memory-core/index.test.ts
+++ b/extensions/memory-core/index.test.ts
@@ -1,5 +1,7 @@
 import type { OpenClawConfig } from "openclaw/plugin-sdk/config-contracts";
-import { describe, expect, it } from "vitest";
+import type { MemoryPluginRuntime } from "openclaw/plugin-sdk/memory-core-host-runtime-core";
+import { createTestPluginApi } from "openclaw/plugin-sdk/plugin-test-api";
+import { beforeEach, describe, expect, it, vi } from "vitest";
 import {
   buildMemoryFlushPlan,
   DEFAULT_MEMORY_FLUSH_FORCE_TRANSCRIPT_BYTES,
@@ -8,6 +10,33 @@ import {
 } from "./src/flush-plan.js";
 import { buildPromptSection } from "./src/prompt-section.js";
 
+const closeMemorySearchManagerMock = vi.hoisted(() => vi.fn(async () => {}));
+
+vi.mock("./src/runtime-provider.js", () => ({
+  memoryRuntime: {
+    closeAllMemorySearchManagers: vi.fn(async () => {}),
+    closeMemorySearchManager: closeMemorySearchManagerMock,
+    getMemorySearchManager: vi.fn(async () => null),
+  },
+}));
+
+import plugin from "./index.js";
+
+function registerMemoryCoreRuntime(): MemoryPluginRuntime {
+  let runtime: MemoryPluginRuntime | undefined;
+  plugin.register(
+    createTestPluginApi({
+      registerMemoryCapability(capability) {
+        runtime = capability.runtime;
+      },
+    }),
+  );
+  if (!runtime) {
+    throw new Error("expected memory-core to register a memory runtime");
+  }
+  return runtime;
+}
+
 describe("buildPromptSection", () => {
   it("returns empty when no memory tools are available", () => {
     expect(buildPromptSection({ availableTools: new Set() })).toStrictEqual([]);
@@ -53,6 +82,21 @@ describe("buildPromptSection", () => {
   });
 });
 
+describe("memory-core plugin runtime registration", () => {
+  beforeEach(() => {
+    vi.clearAllMocks();
+  });
+
+  it("wires scoped memory search cleanup through the lazy runtime", async () => {
+    const runtime = registerMemoryCoreRuntime();
+    const cfg = {} as OpenClawConfig;
+
+    await runtime.closeMemorySearchManager?.({ cfg, agentId: "main" });
+
+    expect(closeMemorySearchManagerMock).toHaveBeenCalledWith({ cfg, agentId: "main" });
+  });
+});
+
 describe("buildMemoryFlushPlan", () => {
   const cfg = {
     agents: {
diff --git a/extensions/memory-core/index.ts b/extensions/memory-core/index.ts
index 9913393ee8d..56c4b550987 100644
--- a/extensions/memory-core/index.ts
+++ b/extensions/memory-core/index.ts
@@ -166,6 +166,10 @@ const memoryRuntime: MemoryPluginRuntime = {
     const { memoryRuntime: runtime } = await loadRuntimeProviderModule();
     await runtime.closeAllMemorySearchManagers?.();
   },
+  async closeMemorySearchManager(params) {
+    const { memoryRuntime: runtime } = await loadRuntimeProviderModule();
+    await runtime.closeMemorySearchManager?.(params);
+  },
 };
 export default definePluginEntry({
   id: "memory-core",
diff --git a/extensions/memory-core/manager-runtime.ts b/extensions/memory-core/manager-runtime.ts
index 4a09eb8c3ea..738bbb4e1dc 100644
--- a/extensions/memory-core/manager-runtime.ts
+++ b/extensions/memory-core/manager-runtime.ts
@@ -1 +1,5 @@
-export { closeAllMemoryIndexManagers, MemoryIndexManager } from "./src/memory/manager-runtime.js";
+export {
+  closeAllMemoryIndexManagers,
+  closeMemoryIndexManagersForAgent,
+  MemoryIndexManager,
+} from "./src/memory/manager-runtime.js";
diff --git a/extensions/memory-core/src/memory/index.test.ts b/extensions/memory-core/src/memory/index.test.ts
index b73dc12549d..ee75b9900ac 100644
--- a/extensions/memory-core/src/memory/index.test.ts
+++ b/extensions/memory-core/src/memory/index.test.ts
@@ -12,7 +12,7 @@ import { afterAll, afterEach, beforeAll, beforeEach, describe, expect, it, vi }
 import "./test-runtime-mocks.js";
 import type { MemoryIndexManager } from "./index.js";
 import { closeAllMemorySearchManagers, getMemorySearchManager } from "./index.js";
-import { EMBEDDING_PROBE_CACHE_TTL_MS } from "./manager.js";
+import { closeMemoryIndexManagersForAgent, EMBEDDING_PROBE_CACHE_TTL_MS } from "./manager.js";
 import {
   DEFAULT_LOCAL_MODEL,
   registerBuiltInMemoryEmbeddingProviders,
@@ -28,6 +28,9 @@ afterAll(() => {
 
 let embedBatchCalls = 0;
 let embedBatchInputCalls = 0;
+let providerCloseCalls = 0;
+let providerCloseFailuresRemaining = 0;
+let providerCloseGate: Promise<void> | null = null;
 let providerCalls: Array<{ provider?: string; model?: string; outputDimensionality?: number }> = [];
 let forceNoProvider = false;
 
@@ -65,6 +68,14 @@ vi.mock("./embeddings.js", () => {
         provider: {
           id: providerId,
           model,
+          close: async () => {
+            providerCloseCalls += 1;
+            await providerCloseGate;
+            if (providerCloseFailuresRemaining > 0) {
+              providerCloseFailuresRemaining -= 1;
+              throw new Error("provider close failed");
+            }
+          },
           embedQuery: async (text: string) => embedText(text),
           embedBatch: async (texts: string[]) => {
             embedBatchCalls += 1;
@@ -188,6 +199,9 @@ describe("memory index", () => {
     registerBuiltInMemoryEmbeddingProviders({ registerMemoryEmbeddingProvider: registerAdapter });
     embedBatchCalls = 0;
     embedBatchInputCalls = 0;
+    providerCloseCalls = 0;
+    providerCloseFailuresRemaining = 0;
+    providerCloseGate = null;
     providerCalls = [];
     forceNoProvider = false;
 
@@ -354,6 +368,96 @@ describe("memory index", () => {
     }
   });
 
+  it("closes embedding providers when memory index managers close", async () => {
+    const cfg = createCfg({
+      storePath: indexMainPath,
+      hybrid: { enabled: true, vectorWeight: 0.5, textWeight: 0.5 },
+    });
+    const manager = await getFreshManager(cfg);
+
+    await manager.probeEmbeddingAvailability();
+    expect(providerCloseCalls).toBe(0);
+
+    await manager.close();
+    await manager.close();
+
+    expect(providerCloseCalls).toBe(1);
+  });
+
+  it("closes embedding providers before waiting for pending sync to settle", async () => {
+    const cfg = createCfg({
+      storePath: indexMainPath,
+      hybrid: { enabled: true, vectorWeight: 0.5, textWeight: 0.5 },
+    });
+    const manager = await getFreshManager(cfg);
+    await manager.probeEmbeddingAvailability();
+    let resolveSync: () => void = () => {};
+    (manager as unknown as { syncing: Promise<void> }).syncing = new Promise<void>((resolve) => {
+      resolveSync = resolve;
+    });
+
+    const closePromise = manager.close();
+    await vi.waitFor(() => {
+      expect(providerCloseCalls).toBe(1);
+    });
+    let closeSettled = false;
+    void closePromise.then(() => {
+      closeSettled = true;
+    });
+    await Promise.resolve();
+
+    expect(closeSettled).toBe(false);
+    resolveSync();
+    await closePromise;
+  });
+
+  it("evicts scoped memory index managers before close settles", async () => {
+    let releaseProviderClose: () => void = () => {};
+    providerCloseGate = new Promise<void>((resolve) => {
+      releaseProviderClose = resolve;
+    });
+    const cfg = createCfg({
+      storePath: indexMainPath,
+      hybrid: { enabled: true, vectorWeight: 0.5, textWeight: 0.5 },
+    });
+    const first = requireManager(await getMemorySearchManager({ cfg, agentId: "main" }));
+    managersForCleanup.add(first);
+    await first.probeEmbeddingAvailability();
+    const closePromise = closeMemoryIndexManagersForAgent({ cfg, agentId: "main" });
+    let second: MemoryIndexManager | null = null;
+    try {
+      await vi.waitFor(() => {
+        expect(providerCloseCalls).toBe(1);
+      });
+
+      second = requireManager(await getMemorySearchManager({ cfg, agentId: "main" }));
+      managersForCleanup.add(second);
+      expect(second).not.toBe(first);
+    } finally {
+      releaseProviderClose();
+      providerCloseGate = null;
+    }
+    await closePromise;
+
+    const third = requireManager(await getMemorySearchManager({ cfg, agentId: "main" }));
+    managersForCleanup.add(third);
+    expect(third).toBe(second);
+  });
+
+  it("retries embedding provider close before releasing the manager", async () => {
+    providerCloseFailuresRemaining = 1;
+    const cfg = createCfg({
+      storePath: indexMainPath,
+      hybrid: { enabled: true, vectorWeight: 0.5, textWeight: 0.5 },
+    });
+    const manager = await getFreshManager(cfg);
+
+    await manager.probeEmbeddingAvailability();
+    await manager.close();
+
+    expect(providerCloseCalls).toBe(2);
+  });
+
   it("indexes multimodal image and audio files from extra paths with Gemini structured inputs", async () => {
     const mediaDir = path.join(workspaceDir, "media-memory");
     await fs.mkdir(mediaDir, { recursive: true });
diff --git a/extensions/memory-core/src/memory/index.ts b/extensions/memory-core/src/memory/index.ts
index 5e3b726c8f3..e4ad63af939 100644
--- a/extensions/memory-core/src/memory/index.ts
+++ b/extensions/memory-core/src/memory/index.ts
@@ -6,6 +6,7 @@ export type {
 } from "openclaw/plugin-sdk/memory-core-host-engine-storage";
 export {
   closeAllMemorySearchManagers,
+  closeMemorySearchManager,
   getMemorySearchManager,
   type MemorySearchManagerPurpose,
   type MemorySearchManagerResult,
diff --git a/extensions/memory-core/src/memory/manager-runtime.ts b/extensions/memory-core/src/memory/manager-runtime.ts
index 3e910b5676a..3493238b80f 100644
--- a/extensions/memory-core/src/memory/manager-runtime.ts
+++ b/extensions/memory-core/src/memory/manager-runtime.ts
@@ -1 +1,5 @@
-export { closeAllMemoryIndexManagers, MemoryIndexManager } from "./manager.js";
+export {
+  closeAllMemoryIndexManagers,
+  closeMemoryIndexManagersForAgent,
+  MemoryIndexManager,
+} from "./manager.js";
diff --git a/extensions/memory-core/src/memory/manager.ts b/extensions/memory-core/src/memory/manager.ts
index 645e53272ad..684c18661e3 100644
--- a/extensions/memory-core/src/memory/manager.ts
+++ b/extensions/memory-core/src/memory/manager.ts
@@ -86,6 +86,32 @@ export async function closeAllMemoryIndexManagers(): Promise<void> {
   });
 }
 
+export async function closeMemoryIndexManagersForAgent(params: {
+  cfg: OpenClawConfig;
+  agentId: string;
+}): Promise<void> {
+  const settings = resolveMemorySearchConfig(params.cfg, params.agentId);
+  if (!settings) {
+    return;
+  }
+  const workspaceDir = resolveAgentWorkspaceDir(params.cfg, params.agentId);
+  const key = `${params.agentId}:${workspaceDir}:${JSON.stringify(settings)}:default`;
+  const pending = INDEX_CACHE_PENDING.get(key);
+  if (pending) {
+    await Promise.allSettled([pending]);
+  }
+  const manager = INDEX_CACHE.get(key);
+  if (!manager) {
+    return;
+  }
+  INDEX_CACHE.delete(key);
+  try {
+    await manager.close();
+  } catch (err) {
+    log.warn(`failed to close memory index manager for agent ${params.agentId}: ${String(err)}`);
+  }
+}
+
 export class MemoryIndexManager extends MemoryManagerEmbeddingOps implements MemorySearchManager {
   private readonly cacheKey: string;
   protected readonly cfg: OpenClawConfig;
@@ -933,8 +959,36 @@ export class MemoryIndexManager extends MemoryManagerEmbeddingOps implements Mem
       this.sessionUnsubscribe();
       this.sessionUnsubscribe = null;
     }
-    await awaitPendingManagerWork({ pendingSync, pendingProviderInit });
-    closeMemoryDatabase(this.db);
-    INDEX_CACHE.delete(this.cacheKey);
+    const closeErrors = new Map<EmbeddingProvider, unknown>();
+    const closeCurrentProvider = async () => {
+      const provider = this.provider;
+      if (!provider) {
+        return;
+      }
+      try {
+        await provider.close?.();
+        closeErrors.delete(provider);
+        if (this.provider === provider) {
+          this.provider = null;
+        }
+      } catch (err) {
+        closeErrors.set(provider, err);
+      }
+    };
+    await awaitPendingManagerWork({ pendingProviderInit });
+    await closeCurrentProvider();
+    try {
+      await awaitPendingManagerWork({ pendingSync });
+      await closeCurrentProvider();
+    } finally {
+      closeMemoryDatabase(this.db);
+      if (INDEX_CACHE.get(this.cacheKey) === this) {
+        INDEX_CACHE.delete(this.cacheKey);
+      }
+    }
+    const closeError = closeErrors.values().next().value;
+    if (closeError) {
+      throw closeError;
+    }
   }
 }
diff --git a/extensions/memory-core/src/memory/search-manager.test.ts b/extensions/memory-core/src/memory/search-manager.test.ts
index 8423103e7bb..51bb2862742 100644
--- a/extensions/memory-core/src/memory/search-manager.test.ts
+++ b/extensions/memory-core/src/memory/search-manager.test.ts
@@ -109,6 +109,7 @@ const fallbackManager = vi.hoisted(() => ({
 const fallbackSearch = fallbackManager.search;
 const mockMemoryIndexGet = vi.hoisted(() => vi.fn(async () => fallbackManager));
 const mockCloseAllMemoryIndexManagers = vi.hoisted(() => vi.fn(async () => {}));
+const mockCloseMemoryIndexManagersForAgent = vi.hoisted(() => vi.fn(async () => {}));
 const checkQmdBinaryAvailability = vi.hoisted(() =>
   vi.fn<CheckQmdBinaryAvailability>(async () => ({ available: true })),
 );
@@ -128,10 +129,15 @@ vi.mock("../../manager-runtime.js", () => ({
     get: mockMemoryIndexGet,
   },
   closeAllMemoryIndexManagers: mockCloseAllMemoryIndexManagers,
+  closeMemoryIndexManagersForAgent: mockCloseMemoryIndexManagersForAgent,
 }));
 
 import { QmdMemoryManager } from "./qmd-manager.js";
-import { closeAllMemorySearchManagers, getMemorySearchManager } from "./search-manager.js";
+import {
+  closeAllMemorySearchManagers,
+  closeMemorySearchManager,
+  getMemorySearchManager,
+} from "./search-manager.js";
 const createQmdManagerMock = vi.mocked(QmdMemoryManager.create);
 
 type QmdManagerInstance = Awaited<ReturnType<typeof QmdMemoryManager.create>>;
@@ -280,6 +286,7 @@ beforeEach(async () => {
   fallbackManager.probeVectorAvailability.mockClear();
   fallbackManager.close.mockClear();
   mockCloseAllMemoryIndexManagers.mockClear();
+  mockCloseMemoryIndexManagersForAgent.mockClear();
   mockMemoryIndexGet.mockClear();
   mockMemoryIndexGet.mockResolvedValue(fallbackManager);
   checkQmdBinaryAvailability.mockClear();
@@ -383,6 +390,27 @@ describe("getMemorySearchManager caching", () => {
     }
   });
 
+  it("preserves qmd open-failure cooldown when scoped teardown closes no qmd manager", async () => {
+    const agentId = "qmd-open-cooldown-scoped-close";
+    const cfg = createQmdCfg(agentId);
+    const nowSpy = vi.spyOn(Date, "now").mockReturnValue(1_000);
+    createQmdManagerMock.mockRejectedValueOnce(new Error("Cannot find package 'chokidar'"));
+
+    try {
+      const first = await getMemorySearchManager({ cfg, agentId });
+      expect(first.manager).toBe(fallbackManager);
+      expect(createQmdManagerMock).toHaveBeenCalledTimes(1);
+
+      await closeMemorySearchManager({ cfg, agentId });
+
+      const second = await getMemorySearchManager({ cfg, agentId });
+      expect(second.manager).toBe(fallbackManager);
+      expect(createQmdManagerMock).toHaveBeenCalledTimes(1);
+    } finally {
+      nowSpy.mockRestore();
+    }
+  });
+
   it("lets status probes bypass and clear a full qmd open-failure cooldown", async () => {
     const agentId = "qmd-open-status-bypass";
     const cfg = createQmdCfg(agentId);
@@ -930,6 +958,46 @@ describe("getMemorySearchManager caching", () => {
     expect(createQmdManagerMock.mock.calls).toHaveLength(2);
   });
 
+  it("closes only the requested agent qmd manager on scoped teardown", async () => {
+    const mainCfg = createQmdCfg("main");
+    const otherPrimary = createQmdManagerInstanceMock();
+    createQmdManagerMock.mockImplementationOnce(
+      async () => mockPrimary as unknown as QmdManagerInstance,
+    );
+    createQmdManagerMock.mockImplementationOnce(
+      async () => otherPrimary as unknown as QmdManagerInstance,
+    );
+
+    const main = await getMemorySearchManager({ cfg: mainCfg, agentId: "main" });
+    const other = await getMemorySearchManager({ cfg: createQmdCfg("other"), agentId: "other" });
+    const mainManager = requireManager(main);
+    const otherManager = requireManager(other);
+
+    await closeMemorySearchManager({ cfg: mainCfg, agentId: "main" });
+
+    expect(mockPrimary.close).toHaveBeenCalledTimes(1);
+    expect(otherPrimary.close).not.toHaveBeenCalled();
+    const nextMain = await getMemorySearchManager({ cfg: mainCfg, agentId: "main" });
+    const nextOther = await getMemorySearchManager({
+      cfg: createQmdCfg("other"),
+      agentId: "other",
+    });
+    expect(nextMain.manager).not.toBe(mainManager);
+    expect(nextOther.manager).toBe(otherManager);
+  });
+
+  it("closes the requested agent builtin index manager on scoped teardown", async () => {
+    const cfg = createBuiltinCfg("main");
+    await getMemorySearchManager({ cfg, agentId: "main" });
+
+    await closeMemorySearchManager({ cfg, agentId: "main" });
+
+    expect(mockCloseMemoryIndexManagersForAgent).toHaveBeenCalledWith({
+      cfg,
+      agentId: "main",
+    });
+  });
+
   it("waits for pending full qmd manager creation during global teardown", async () => {
     const agentId = "teardown-pending-qmd";
     const cfg = createQmdCfg(agentId);
diff --git a/extensions/memory-core/src/memory/search-manager.ts b/extensions/memory-core/src/memory/search-manager.ts
index b19544ba983..6d1377f1360 100644
--- a/extensions/memory-core/src/memory/search-manager.ts
+++ b/extensions/memory-core/src/memory/search-manager.ts
@@ -400,6 +400,32 @@ export async function closeAllMemorySearchManagers(): Promise<void> {
   }
 }
 
+export async function closeMemorySearchManager(params: {
+  cfg: OpenClawConfig;
+  agentId: string;
+}): Promise<void> {
+  const normalizedAgentId = normalizeAgentId(params.agentId);
+  const scopeKey = buildQmdManagerScopeKey(normalizedAgentId);
+  const pending = PENDING_QMD_MANAGER_CREATES.get(scopeKey);
+  if (pending) {
+    await Promise.allSettled([pending.promise]);
+  }
+  const cached = QMD_MANAGER_CACHE.get(scopeKey);
+  if (cached) {
+    QMD_MANAGER_CACHE.delete(scopeKey);
+    QMD_MANAGER_OPEN_FAILURES.delete(scopeKey);
+    try {
+      await cached.manager.close?.();
+    } catch (err) {
+      log.warn(`failed to close qmd memory manager for agent ${normalizedAgentId}: ${String(err)}`);
+    }
+  }
+  if (managerRuntimePromise !== null) {
+    const { closeMemoryIndexManagersForAgent } = await loadManagerRuntime();
+    await closeMemoryIndexManagersForAgent({ cfg: params.cfg, agentId: normalizedAgentId });
+  }
+}
+
 class FallbackMemoryManager implements MemorySearchManager {
   private fallback: Maybe<MemorySearchManager> = null;
   private primaryFailed = false;
diff --git a/extensions/memory-core/src/runtime-provider.ts b/extensions/memory-core/src/runtime-provider.ts
index 8d1de9aa574..1eedc5987e3 100644
--- a/extensions/memory-core/src/runtime-provider.ts
+++ b/extensions/memory-core/src/runtime-provider.ts
@@ -1,6 +1,10 @@
 import type { MemoryPluginRuntime } from "openclaw/plugin-sdk/memory-core-host-runtime-core";
 import { resolveMemoryBackendConfig } from "openclaw/plugin-sdk/memory-core-host-runtime-files";
-import { closeAllMemorySearchManagers, getMemorySearchManager } from "./memory/index.js";
+import {
+  closeAllMemorySearchManagers,
+  closeMemorySearchManager,
+  getMemorySearchManager,
+} from "./memory/index.js";
 
 export const memoryRuntime: MemoryPluginRuntime = {
   async getMemorySearchManager(params) {
@@ -16,4 +20,7 @@ export const memoryRuntime: MemoryPluginRuntime = {
   async closeAllMemorySearchManagers() {
     await closeAllMemorySearchManagers();
   },
+  async closeMemorySearchManager(params) {
+    await closeMemorySearchManager(params);
+  },
 };
diff --git a/packages/memory-host-sdk/src/host/embeddings.test.ts b/packages/memory-host-sdk/src/host/embeddings.test.ts
index 245caefc6a7..c01343401f1 100644
--- a/packages/memory-host-sdk/src/host/embeddings.test.ts
+++ b/packages/memory-host-sdk/src/host/embeddings.test.ts
@@ -17,19 +17,45 @@ afterEach(() => {
   vi.resetAllMocks();
 });
 
+function createDeferred<T>() {
+  let resolve: ((value: T) => void) | undefined;
+  let reject: ((reason?: unknown) => void) | undefined;
+  const promise = new Promise<T>((res, rej) => {
+    resolve = res;
+    reject = rej;
+  });
+  if (!resolve || !reject) {
+    throw new Error("Expected deferred callbacks to be initialized");
+  }
+  return { promise, resolve, reject };
+}
+
 function mockLocalEmbeddingRuntime(vector = new Float32Array([2.35, 3.45, 0.63, 4.3])) {
+  const disposeContext = vi.fn();
+  const disposeModel = vi.fn();
+  const disposeLlama = vi.fn();
   const getEmbeddingFor = vi.fn().mockResolvedValue({ vector });
-  const createEmbeddingContext = vi.fn().mockResolvedValue({ getEmbeddingFor });
-  const loadModel = vi.fn().mockResolvedValue({ createEmbeddingContext });
+  const createEmbeddingContext = vi
+    .fn()
+    .mockResolvedValue({ getEmbeddingFor, dispose: disposeContext });
+  const loadModel = vi.fn().mockResolvedValue({ createEmbeddingContext, dispose: disposeModel });
   const resolveModelFile = vi.fn(async (modelPath: string) => `/resolved/${modelPath}`);
 
   nodeLlamaMock.importNodeLlamaCpp.mockResolvedValue({
-    getLlama: async () => ({ loadModel }),
+    getLlama: async () => ({ loadModel, dispose: disposeLlama }),
     resolveModelFile,
     LlamaLogLevel: { error: 0 },
   } as never);
 
-  return { createEmbeddingContext, getEmbeddingFor, loadModel, resolveModelFile };
+  return {
+    createEmbeddingContext,
+    disposeContext,
+    disposeLlama,
+    disposeModel,
+    getEmbeddingFor,
+    loadModel,
+    resolveModelFile,
+  };
 }
 
 describe("local embedding provider", () => {
@@ -50,7 +76,16 @@ describe("local embedding provider", () => {
       "hf:ggml-org/embeddinggemma-300m-qat-q8_0-GGUF/embeddinggemma-300m-qat-Q8_0.gguf",
     );
     expect(magnitude).toBeCloseTo(1, 5);
-    expect(runtime.resolveModelFile).toHaveBeenCalledWith(DEFAULT_LOCAL_MODEL, undefined);
+    expect(runtime.resolveModelFile).toHaveBeenCalledWith(
+      DEFAULT_LOCAL_MODEL,
+      expect.objectContaining({ signal: expect.any(AbortSignal) }),
+    );
+    expect(runtime.loadModel).toHaveBeenCalledWith(
+      expect.objectContaining({
+        modelPath: `/resolved/${DEFAULT_LOCAL_MODEL}`,
+        loadSignal: expect.any(AbortSignal),
+      }),
+    );
     expect(runtime.getEmbeddingFor).toHaveBeenCalledWith("test query");
   });
 
@@ -66,7 +101,9 @@ describe("local embedding provider", () => {
 
     await provider.embedQuery("context size default test");
 
-    expect(runtime.createEmbeddingContext).toHaveBeenCalledWith({ contextSize: 4096 });
+    expect(runtime.createEmbeddingContext).toHaveBeenCalledWith(
+      expect.objectContaining({ contextSize: 4096, createSignal: expect.any(AbortSignal) }),
+    );
   });
 
   it("passes configured contextSize to createEmbeddingContext", async () => {
@@ -82,7 +119,9 @@ describe("local embedding provider", () => {
 
     await provider.embedQuery("context size custom test");
 
-    expect(runtime.createEmbeddingContext).toHaveBeenCalledWith({ contextSize: 2048 });
+    expect(runtime.createEmbeddingContext).toHaveBeenCalledWith(
+      expect.objectContaining({ contextSize: 2048, createSignal: expect.any(AbortSignal) }),
+    );
   });
 
   it('passes "auto" contextSize to createEmbeddingContext when explicitly set', async () => {
@@ -98,7 +137,9 @@ describe("local embedding provider", () => {
 
     await provider.embedQuery("context size auto test");
 
-    expect(runtime.createEmbeddingContext).toHaveBeenCalledWith({ contextSize: "auto" });
+    expect(runtime.createEmbeddingContext).toHaveBeenCalledWith(
+      expect.objectContaining({ contextSize: "auto", createSignal: expect.any(AbortSignal) }),
+    );
   });
 
   it("trims explicit local model paths and cache directories", async () => {
@@ -118,7 +159,136 @@ describe("local embedding provider", () => {
     await provider.embedBatch(["a", "b"]);
 
     expect(provider.model).toBe("/models/embed.gguf");
-    expect(runtime.resolveModelFile).toHaveBeenCalledWith("/models/embed.gguf", "/cache/models");
+    expect(runtime.resolveModelFile).toHaveBeenCalledWith(
+      "/models/embed.gguf",
+      expect.objectContaining({
+        directory: "/cache/models",
+        signal: expect.any(AbortSignal),
+      }),
+    );
     expect(runtime.getEmbeddingFor).toHaveBeenCalledTimes(2);
   });
+
+  it("disposes cached local llama resources when closed", async () => {
+    const runtime = mockLocalEmbeddingRuntime();
+
+    const provider = await createLocalEmbeddingProvider({
+      config: {} as never,
+      provider: "local",
+      model: "",
+      fallback: "none",
+    });
+
+    await provider.embedQuery("load local resources");
+    await provider.close?.();
+    await provider.close?.();
+
+    expect(runtime.disposeContext).toHaveBeenCalledTimes(1);
+    expect(runtime.disposeModel).toHaveBeenCalledTimes(1);
+    expect(runtime.disposeLlama).toHaveBeenCalledTimes(1);
+    await expect(provider.embedQuery("after close")).rejects.toThrow(
+      "Local embedding provider has been closed",
+    );
+  });
+
+  it("does not wait for pending local llama initialization before close resolves", async () => {
+    const disposeLlama = vi.fn();
+    const getLlamaGate = createDeferred<unknown>();
+    nodeLlamaMock.importNodeLlamaCpp.mockResolvedValue({
+      getLlama: async () => (await getLlamaGate.promise) as never,
+      resolveModelFile: vi.fn(async (modelPath: string) => `/resolved/${modelPath}`),
+      LlamaLogLevel: { error: 0 },
+    } as never);
+    const provider = await createLocalEmbeddingProvider({
+      config: {} as never,
+      provider: "local",
+      model: "",
+      fallback: "none",
+    });
+
+    const embedPromise = provider.embedQuery("pending init");
+    await expect(provider.close?.()).resolves.toBeUndefined();
+
+    getLlamaGate.resolve({ loadModel: vi.fn(), dispose: disposeLlama });
+    await expect(embedPromise).rejects.toThrow("Local embedding provider has been closed");
+    expect(disposeLlama).toHaveBeenCalledTimes(1);
+  });
+
+  it("aborts pending local llama model loads when closed", async () => {
+    const loadModelStarted = createDeferred<void>();
+    const loadModelGate = createDeferred<never>();
+    const disposeLlama = vi.fn();
+    let capturedResolveSignal: AbortSignal | undefined;
+    let capturedLoadSignal: AbortSignal | undefined;
+    const loadModel = vi.fn(
+      (params: { modelPath: string; loadSignal?: AbortSignal }): Promise<never> => {
+        capturedLoadSignal = params.loadSignal;
+        loadModelStarted.resolve();
+        return loadModelGate.promise;
+      },
+    );
+    nodeLlamaMock.importNodeLlamaCpp.mockResolvedValue({
+      getLlama: async () => ({ loadModel, dispose: disposeLlama }),
+      resolveModelFile: vi.fn(async (_modelPath: string, options?: { signal?: AbortSignal }) => {
+        capturedResolveSignal = options?.signal;
+        return "/resolved/model.gguf";
+      }),
+      LlamaLogLevel: { error: 0 },
+    } as never);
+    const provider = await createLocalEmbeddingProvider({
+      config: {} as never,
+      provider: "local",
+      model: "",
+      fallback: "none",
+    });
+
+    const embedPromise = provider.embedQuery("pending model load");
+    await loadModelStarted.promise;
+    await expect(provider.close?.()).resolves.toBeUndefined();
+
+    expect(capturedResolveSignal?.aborted).toBe(true);
+    expect(capturedLoadSignal?.aborted).toBe(true);
+    expect(disposeLlama).toHaveBeenCalledTimes(1);
+    loadModelGate.reject(new Error("load aborted"));
+    await expect(embedPromise).rejects.toThrow("load aborted");
+  });
+
+  it("aborts pending local llama embedding context creation when closed", async () => {
+    const createContextStarted = createDeferred<void>();
+    const createContextGate = createDeferred<never>();
+    const disposeLlama = vi.fn();
+    const disposeModel = vi.fn();
+    let capturedCreateSignal: AbortSignal | undefined;
+    const createEmbeddingContext = vi.fn(
+      (options?: { createSignal?: AbortSignal }): Promise<never> => {
+        capturedCreateSignal = options?.createSignal;
+        createContextStarted.resolve();
+        return createContextGate.promise;
+      },
+    );
+    nodeLlamaMock.importNodeLlamaCpp.mockResolvedValue({
+      getLlama: async () => ({
+        loadModel: vi.fn(async () => ({ createEmbeddingContext, dispose: disposeModel })),
+        dispose: disposeLlama,
+      }),
+      resolveModelFile: vi.fn(async () => "/resolved/model.gguf"),
+      LlamaLogLevel: { error: 0 },
+    } as never);
+    const provider = await createLocalEmbeddingProvider({
+      config: {} as never,
+      provider: "local",
+      model: "",
+      fallback: "none",
+    });
+
+    const embedPromise = provider.embedQuery("pending context create");
+    await createContextStarted.promise;
+    await expect(provider.close?.()).resolves.toBeUndefined();
+
+    expect(capturedCreateSignal?.aborted).toBe(true);
+    expect(disposeModel).toHaveBeenCalledTimes(1);
+    expect(disposeLlama).toHaveBeenCalledTimes(1);
+    createContextGate.reject(new Error("context create aborted"));
+    await expect(embedPromise).rejects.toThrow("context create aborted");
+  });
 });
diff --git a/packages/memory-host-sdk/src/host/embeddings.ts b/packages/memory-host-sdk/src/host/embeddings.ts
index 97287160b73..e5449dda904 100644
--- a/packages/memory-host-sdk/src/host/embeddings.ts
+++ b/packages/memory-host-sdk/src/host/embeddings.ts
@@ -9,6 +9,10 @@ import {
 } from "./node-llama.js";
 import { normalizeOptionalString } from "./string-utils.js";
 
+type DisposableResource = {
+  dispose?: () => Promise<void> | void;
+};
+
 export type {
   EmbeddingProvider,
   EmbeddingProviderFallback,
@@ -20,6 +24,22 @@ export type {
 
 export { DEFAULT_LOCAL_MODEL } from "./embedding-defaults.js";
 
+async function disposeResources(
+  resources: Array<DisposableResource | null | undefined>,
+): Promise<void> {
+  let firstError: unknown;
+  for (const resource of resources) {
+    try {
+      await resource?.dispose?.();
+    } catch (err) {
+      firstError ??= err;
+    }
+  }
+  if (firstError) {
+    throw firstError;
+  }
+}
+
 export async function createLocalEmbeddingProvider(
   options: EmbeddingProviderOptions,
 ): Promise<EmbeddingProvider> {
@@ -34,8 +54,26 @@ export async function createLocalEmbeddingProvider(
   let embeddingModel: LlamaModel | null = null;
   let embeddingContext: LlamaEmbeddingContext | null = null;
   let initPromise: Promise<LlamaEmbeddingContext> | null = null;
+  let initAbortController: AbortController | null = null;
+  let closePromise: Promise<void> | null = null;
+  let closed = false;
+
+  const throwIfClosed = () => {
+    if (closed) {
+      throw new Error("Local embedding provider has been closed");
+    }
+  };
+  const disposeAndThrowIfClosed = async <T extends DisposableResource>(resource: T): Promise<T> => {
+    if (!closed) {
+      return resource;
+    }
+    await disposeResources([resource]);
+    throwIfClosed();
+    return resource;
+  };
 
   const ensureContext = async (): Promise<LlamaEmbeddingContext> => {
+    throwIfClosed();
     if (embeddingContext) {
       return embeddingContext;
     }
@@ -43,21 +81,40 @@ export async function createLocalEmbeddingProvider(
       return initPromise;
     }
     initPromise = (async () => {
+      const abortController = new AbortController();
+      initAbortController = abortController;
       try {
         if (!llama) {
-          llama = await getLlama({ logLevel: LlamaLogLevel.error });
+          const nextLlama = await getLlama({ logLevel: LlamaLogLevel.error });
+          llama = await disposeAndThrowIfClosed(nextLlama);
         }
         if (!embeddingModel) {
-          const resolved = await resolveModelFile(modelPath, modelCacheDir || undefined);
-          embeddingModel = await llama.loadModel({ modelPath: resolved });
+          const resolved = await resolveModelFile(modelPath, {
+            ...(modelCacheDir ? { directory: modelCacheDir } : {}),
+            signal: abortController.signal,
+          });
+          throwIfClosed();
+          const nextModel = await llama.loadModel({
+            modelPath: resolved,
+            loadSignal: abortController.signal,
+          });
+          embeddingModel = await disposeAndThrowIfClosed(nextModel);
         }
         if (!embeddingContext) {
-          embeddingContext = await embeddingModel.createEmbeddingContext({ contextSize });
+          const nextContext = await embeddingModel.createEmbeddingContext({
+            contextSize,
+            createSignal: abortController.signal,
+          });
+          embeddingContext = await disposeAndThrowIfClosed(nextContext);
         }
         return embeddingContext;
       } catch (err) {
         initPromise = null;
         throw err;
+      } finally {
+        if (initAbortController === abortController) {
+          initAbortController = null;
+        }
       }
     })();
     return initPromise;
@@ -67,18 +124,23 @@ export async function createLocalEmbeddingProvider(
     id: "local",
     model: modelPath,
     embedQuery: async (text, options) => {
+      throwIfClosed();
       options?.signal?.throwIfAborted();
       const ctx = await ensureContext();
+      throwIfClosed();
       options?.signal?.throwIfAborted();
       const embedding = await ctx.getEmbeddingFor(text);
       return sanitizeAndNormalizeEmbedding(Array.from(embedding.vector));
     },
     embedBatch: async (texts, options) => {
+      throwIfClosed();
       options?.signal?.throwIfAborted();
       const ctx = await ensureContext();
+      throwIfClosed();
       options?.signal?.throwIfAborted();
       const embeddings = await Promise.all(
         texts.map(async (text) => {
+          throwIfClosed();
           options?.signal?.throwIfAborted();
           const embedding = await ctx.getEmbeddingFor(text);
           return sanitizeAndNormalizeEmbedding(Array.from(embedding.vector));
@@ -86,5 +148,24 @@ export async function createLocalEmbeddingProvider(
       );
       return embeddings;
     },
+    close: async () => {
+      if (closePromise) {
+        return closePromise;
+      }
+      closed = true;
+      initAbortController?.abort();
+      initAbortController = null;
+      closePromise = (async () => {
+        const context = embeddingContext;
+        const model = embeddingModel;
+        const runtime = llama;
+        embeddingContext = null;
+        embeddingModel = null;
+        llama = null;
+        initPromise = null;
+        await disposeResources([context, model, runtime]);
+      })();
+      return closePromise;
+    },
   };
 }
diff --git a/packages/memory-host-sdk/src/host/embeddings.types.ts b/packages/memory-host-sdk/src/host/embeddings.types.ts
index 8b24b533a84..6a0e1083a8b 100644
--- a/packages/memory-host-sdk/src/host/embeddings.types.ts
+++ b/packages/memory-host-sdk/src/host/embeddings.types.ts
@@ -11,6 +11,7 @@ export type EmbeddingProvider = {
     inputs: EmbeddingInput[],
     options?: EmbeddingProviderCallOptions,
   ) => Promise<number[][]>;
+  close?: () => Promise<void> | void;
 };
 
 export type EmbeddingProviderCallOptions = {
diff --git a/packages/memory-host-sdk/src/host/node-llama.ts b/packages/memory-host-sdk/src/host/node-llama.ts
index 8871b65da2e..79891bb7b0a 100644
--- a/packages/memory-host-sdk/src/host/node-llama.ts
+++ b/packages/memory-host-sdk/src/host/node-llama.ts
@@ -4,16 +4,25 @@ export type LlamaEmbedding = {
 
 export type LlamaEmbeddingContext = {
   getEmbeddingFor: (text: string) => Promise<LlamaEmbedding>;
+  dispose?: () => Promise<void> | void;
 };
 
 export type LlamaModel = {
   createEmbeddingContext: (options?: {
     contextSize?: number | "auto";
+    createSignal?: AbortSignal;
   }) => Promise<LlamaEmbeddingContext>;
+  dispose?: () => Promise<void> | void;
+};
+
+export type ResolveModelFileOptions = {
+  directory?: string;
+  signal?: AbortSignal;
 };
 
 export type Llama = {
-  loadModel: (params: { modelPath: string }) => Promise<LlamaModel>;
+  loadModel: (params: { modelPath: string; loadSignal?: AbortSignal }) => Promise<LlamaModel>;
+  dispose?: () => Promise<void> | void;
 };
 
 export type NodeLlamaCppModule = {
@@ -21,7 +30,10 @@ export type NodeLlamaCppModule = {
     error: number;
   };
   getLlama: (params: { logLevel: number }) => Promise<Llama>;
-  resolveModelFile: (modelPath: string, cacheDir?: string) => Promise<string>;
+  resolveModelFile: (
+    modelPath: string,
+    optionsOrDirectory?: string | ResolveModelFileOptions,
+  ) => Promise<string>;
 };
 
 const NODE_LLAMA_CPP_MODULE = "node-llama-cpp";
diff --git a/src/plugin-sdk/memory-host-search.runtime.ts b/src/plugin-sdk/memory-host-search.runtime.ts
index 5fc023afce2..5c81f64a90f 100644
--- a/src/plugin-sdk/memory-host-search.runtime.ts
+++ b/src/plugin-sdk/memory-host-search.runtime.ts
@@ -1,4 +1,5 @@
 export {
+  closeActiveMemorySearchManager,
   closeActiveMemorySearchManagers,
   getActiveMemorySearchManager,
   resolveActiveMemoryBackendConfig,
diff --git a/src/plugin-sdk/memory-host-search.test.ts b/src/plugin-sdk/memory-host-search.test.ts
index 7a08c97fc7c..09ac487464e 100644
--- a/src/plugin-sdk/memory-host-search.test.ts
+++ b/src/plugin-sdk/memory-host-search.test.ts
@@ -1,24 +1,30 @@
 import { beforeEach, describe, expect, it, vi } from "vitest";
 import type { OpenClawConfig } from "../config/config.js";
 import {
+  closeActiveMemorySearchManager,
   closeActiveMemorySearchManagers,
   getActiveMemorySearchManager,
 } from "./memory-host-search.js";
 
-const { closeActiveMemorySearchManagersMock, getActiveMemorySearchManagerMock } = vi.hoisted(
-  () => ({
-    closeActiveMemorySearchManagersMock: vi.fn(),
-    getActiveMemorySearchManagerMock: vi.fn(),
-  }),
-);
+const {
+  closeActiveMemorySearchManagerMock,
+  closeActiveMemorySearchManagersMock,
+  getActiveMemorySearchManagerMock,
+} = vi.hoisted(() => ({
+  closeActiveMemorySearchManagerMock: vi.fn(),
+  closeActiveMemorySearchManagersMock: vi.fn(),
+  getActiveMemorySearchManagerMock: vi.fn(),
+}));
 
 vi.mock("./memory-host-search.runtime.js", () => ({
+  closeActiveMemorySearchManager: closeActiveMemorySearchManagerMock,
   closeActiveMemorySearchManagers: closeActiveMemorySearchManagersMock,
   getActiveMemorySearchManager: getActiveMemorySearchManagerMock,
 }));
 
 describe("memory-host-search facade", () => {
   beforeEach(() => {
+    closeActiveMemorySearchManagerMock.mockReset();
     closeActiveMemorySearchManagersMock.mockReset();
     getActiveMemorySearchManagerMock.mockReset();
   });
@@ -39,4 +45,12 @@ describe("memory-host-search facade", () => {
 
     expect(closeActiveMemorySearchManagersMock).toHaveBeenCalledWith(cfg);
   });
+
+  it("delegates scoped runtime cleanup to the lazy runtime module", async () => {
+    const cfg = { agents: { list: [{ id: "main", default: true }] } } as OpenClawConfig;
+
+    await closeActiveMemorySearchManager({ cfg, agentId: "main" });
+
+    expect(closeActiveMemorySearchManagerMock).toHaveBeenCalledWith({ cfg, agentId: "main" });
+  });
 });
diff --git a/src/plugin-sdk/memory-host-search.ts b/src/plugin-sdk/memory-host-search.ts
index 94a692b7897..c31f8939dc6 100644
--- a/src/plugin-sdk/memory-host-search.ts
+++ b/src/plugin-sdk/memory-host-search.ts
@@ -27,3 +27,11 @@ export async function closeActiveMemorySearchManagers(cfg?: OpenClawConfig): Pro
   const runtime = await loadMemoryHostSearchRuntime();
   await runtime.closeActiveMemorySearchManagers(cfg);
 }
+
+export async function closeActiveMemorySearchManager(params: {
+  cfg: OpenClawConfig;
+  agentId: string;
+}): Promise<void> {
+  const runtime = await loadMemoryHostSearchRuntime();
+  await runtime.closeActiveMemorySearchManager(params);
+}
diff --git a/src/plugins/memory-embedding-providers.ts b/src/plugins/memory-embedding-providers.ts
index 10cdc1fb956..83ff0db0d9e 100644
--- a/src/plugins/memory-embedding-providers.ts
+++ b/src/plugins/memory-embedding-providers.ts
@@ -42,6 +42,7 @@ export type MemoryEmbeddingProvider = {
     inputs: EmbeddingInput[],
     options?: MemoryEmbeddingProviderCallOptions,
   ) => Promise<number[][]>;
+  close?: () => Promise<void> | void;
 };
 
 export type MemoryEmbeddingProviderCreateOptions = {
diff --git a/src/plugins/memory-runtime.test.ts b/src/plugins/memory-runtime.test.ts
index d756afc6e33..5fc9e4c3ed2 100644
--- a/src/plugins/memory-runtime.test.ts
+++ b/src/plugins/memory-runtime.test.ts
@@ -45,6 +45,7 @@ vi.mock("./memory-state.js", () => ({
 
 let getActiveMemorySearchManager: typeof import("./memory-runtime.js").getActiveMemorySearchManager;
 let resolveActiveMemoryBackendConfig: typeof import("./memory-runtime.js").resolveActiveMemoryBackendConfig;
+let closeActiveMemorySearchManager: typeof import("./memory-runtime.js").closeActiveMemorySearchManager;
 let closeActiveMemorySearchManagers: typeof import("./memory-runtime.js").closeActiveMemorySearchManagers;
 
 function createMemoryAutoEnableFixture() {
@@ -67,6 +68,7 @@ function createMemoryRuntimeFixture() {
   return {
     getMemorySearchManager: vi.fn(async () => ({ manager: null, error: "no index" })),
     resolveMemoryBackendConfig: vi.fn(() => ({ backend: "builtin" as const })),
+    closeMemorySearchManager: vi.fn(async () => {}),
   };
 }
 
@@ -147,6 +149,7 @@ describe("memory runtime auto-enable loading", () => {
     ({
       getActiveMemorySearchManager,
       resolveActiveMemoryBackendConfig,
+      closeActiveMemorySearchManager,
       closeActiveMemorySearchManagers,
     } = await import("./memory-runtime.js"));
     resolveRuntimePluginRegistryMock.mockReset();
@@ -343,4 +346,18 @@ describe("memory runtime auto-enable loading", () => {
   ] as const)("$name", async ({ config, setup }) => {
     await expectCloseMemoryRuntimeCase({ config, setup });
   });
+
+  it("delegates scoped cleanup to the loaded memory runtime without reloading plugins", async () => {
+    const runtime = createMemoryRuntimeFixture();
+    const cfg = { plugins: {} };
+    getMemoryRuntimeMock.mockReturnValue(runtime);
+
+    await closeActiveMemorySearchManager({ cfg: cfg as never, agentId: "main" });
+
+    expect(runtime.closeMemorySearchManager).toHaveBeenCalledWith({
+      cfg,
+      agentId: "main",
+    });
+    expectNoMemoryRuntimeBootstrap();
+  });
 });
diff --git a/src/plugins/memory-runtime.ts b/src/plugins/memory-runtime.ts
index de3b8a6d1cc..bc8a311feea 100644
--- a/src/plugins/memory-runtime.ts
+++ b/src/plugins/memory-runtime.ts
@@ -74,3 +74,11 @@ export async function closeActiveMemorySearchManagers(cfg?: OpenClawConfig): Pro
   const runtime = getMemoryRuntime();
   await runtime?.closeAllMemorySearchManagers?.();
 }
+
+export async function closeActiveMemorySearchManager(params: {
+  cfg: OpenClawConfig;
+  agentId: string;
+}): Promise<void> {
+  const runtime = getMemoryRuntime();
+  await runtime?.closeMemorySearchManager?.(params);
+}
diff --git a/src/plugins/memory-state.ts b/src/plugins/memory-state.ts
index 98397a3146e..8d93ef8c5e9 100644
--- a/src/plugins/memory-state.ts
+++ b/src/plugins/memory-state.ts
@@ -107,6 +107,7 @@ export type MemoryPluginRuntime = {
     cfg: OpenClawConfig;
     agentId: string;
   }): MemoryRuntimeBackendConfig;
+  closeMemorySearchManager?(params: { cfg: OpenClawConfig; agentId: string }): Promise<void>;
   closeAllMemorySearchManagers?(): Promise<void>;
 };
 
diff --git a/src/types/node-llama-cpp.d.ts b/src/types/node-llama-cpp.d.ts
index 21f91d84a2d..03eed42554a 100644
--- a/src/types/node-llama-cpp.d.ts
+++ b/src/types/node-llama-cpp.d.ts
@@ -7,16 +7,30 @@ declare module "node-llama-cpp" {
 
   export type LlamaEmbeddingContext = {
     getEmbeddingFor: (text: string) => Promise<LlamaEmbedding>;
+    dispose?: () => Promise<void> | void;
   };
 
   export type LlamaModel = {
-    createEmbeddingContext: () => Promise<LlamaEmbeddingContext>;
+    createEmbeddingContext: (options?: {
+      contextSize?: number | "auto";
+      createSignal?: AbortSignal;
+    }) => Promise<LlamaEmbeddingContext>;
+    dispose?: () => Promise<void> | void;
+  };
+
+  export type ResolveModelFileOptions = {
+    directory?: string;
+    signal?: AbortSignal;
   };
 
   export type Llama = {
-    loadModel: (params: { modelPath: string }) => Promise<LlamaModel>;
+    loadModel: (params: { modelPath: string; loadSignal?: AbortSignal }) => Promise<LlamaModel>;
+    dispose?: () => Promise<void> | void;
   };
 
   export function getLlama(params: { logLevel: LlamaLogLevel }): Promise<Llama>;
-  export function resolveModelFile(modelPath: string, cacheDir?: string): Promise<string>;
+  export function resolveModelFile(
+    modelPath: string,
+    optionsOrDirectory?: string | ResolveModelFileOptions,
+  ): Promise<string>;
 }