Add basic memory logging #4234

Weves · 2025-03-07T23:47:06Z

Description

Fixes https://linear.app/danswer/issue/DAN-1544/add-basic-memory-loggin

How Has This Been Tested?

Ran docker compose locally, verified I saw the logs as expected in the dir I expected + verified that on container restart the logs were persisted.

Backporting (check the box to trigger backport action)

Note: You have to check that the action passes, otherwise resolve the conflicts manually and tag the patches.

This PR should be backported (make sure to check that the backport attempt succeeds)
[Optional] Override Linear Check

vercel · 2025-03-07T23:47:10Z

The latest updates on your projects. Learn more about Vercel for Git ↗︎

Name	Status	Preview	Comments	Updated (UTC)
internal-search	✅ Ready (Inspect)	Visit Preview	💬 Add feedback	Mar 8, 2025 3:09am

greptile-apps

PR Summary

Added memory monitoring functionality to track and log process memory usage and CPU metrics across the application, with persistent storage and rotation capabilities.

Added new celery_worker_monitoring in backend/supervisord.conf to handle dedicated memory monitoring tasks
Implemented memory_monitoring.py with rotating file handler (10MB limit, 5 backups) and structured logging format for memory/CPU metrics
Added persistent log_store volume mounted at /var/log/persisted-logs across all Docker Compose configurations
Integrated emit_process_memory function in indexing tasks to track worker memory usage every 60 seconds
Added memory monitoring to both api_server and background services in production configuration for comprehensive coverage

_{10 file(s) reviewed, 6 comment(s)}
_{Edit PR Review Bot Settings | Greptile}

greptile-apps · 2025-03-07T23:47:46Z

backend/onyx/background/celery/memory_monitoring.py

+
+# Create a dedicated logger for memory monitoring
+memory_logger = logging.getLogger("memory_monitoring")
+memory_logger.setLevel(logging.INFO)


style: Set propagate=False to prevent duplicate logs if parent logger has handlers

Suggested change

memory_logger.setLevel(logging.INFO)

memory_logger.setLevel(logging.INFO)

memory_logger.propagate = False

greptile-apps · 2025-03-07T23:47:46Z

deployment/docker_compose/docker-compose.dev.yml

+    # optional, only for debugging purposes
+    volumes:
+      - log_store:/var/log/persisted-logs


style: Volume mount is marked as optional/debugging but is required for memory monitoring to work. Consider removing the 'optional' comment or clarifying when it's needed.

greptile-apps · 2025-03-07T23:47:46Z

backend/onyx/background/celery/memory_monitoring.py

+    except Exception as e:
+        logger.error(f"Error monitoring worker memory: {e}")


style: Generic exception handling masks specific issues like NoSuchProcess or AccessDenied. Consider handling psutil.Error explicitly.

greptile-apps · 2025-03-07T23:47:47Z

backend/onyx/background/celery/memory_monitoring.py

+    try:
+        process = psutil.Process(pid)
+        memory_info = process.memory_info()
+        cpu_percent = process.cpu_percent(interval=0.1)


style: cpu_percent() with interval=0.1 blocks execution. Consider using cpu_percent() without interval for non-blocking operation.

greptile-apps · 2025-03-07T23:48:15Z

deployment/docker_compose/docker-compose.prod-no-letsencrypt.yml

+    volumes:
+      - log_store:/var/log/persisted-logs


logic: Volume mount is only added to background service, but memory_monitoring.py suggests api_server might also need access to write logs

greptile-apps · 2025-03-07T23:48:24Z

deployment/docker_compose/docker-compose.gpu-dev.yml

+    volumes:
+      - log_store:/var/log/persisted-logs


style: Consider adding size limits to the log_store volume to prevent unbounded disk usage

rkuo-danswer · 2025-03-08T00:34:12Z

backend/onyx/background/celery/tasks/indexing/tasks.py

+            pid = job.process.pid
+            if pid is not None:
+                # Only emit memory info once per minute (60 seconds)
+                current_time = time.time()


time.monotonic preferable in most cases

rkuo-danswer · 2025-03-08T00:38:34Z

backend/onyx/background/celery/memory_monitoring.py

+# Regular application logger
+logger = setup_logger()
+
+# Set up a dedicated memory monitoring logger


Will there be sufficient information in the log line to distinguish between various indexing connector sources so we can zero in on what failed? Is there any intention to use this from sources other than indexing where we would need more metadata to distinguish those from indexing metrics?

it should already be possible via the process_name param (+ additional_metadata). I'm not sure if that's what you're referring to?

Add basic memory logging

39bfc6a

Weves requested a review from a team as a code owner March 7, 2025 23:47

vercel bot deployed to Preview March 7, 2025 23:49 View deployment

greptile-apps bot reviewed Mar 7, 2025

View reviewed changes

Small tweaks

c1dbb07

vercel bot deployed to Preview March 7, 2025 23:57 View deployment

rkuo-danswer reviewed Mar 8, 2025

View reviewed changes

rkuo-danswer approved these changes Mar 8, 2025

View reviewed changes

Switch to monotonic

9b16935

Weves enabled auto-merge March 8, 2025 03:05

vercel bot deployed to Preview March 8, 2025 03:09 View deployment

Weves added this pull request to the merge queue Mar 8, 2025

Merged via the queue into main with commit 0d3c72a Mar 8, 2025
9 of 10 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add basic memory logging #4234

Add basic memory logging #4234

Weves commented Mar 7, 2025 •

edited

Loading

vercel bot commented Mar 7, 2025 •

edited

Loading

greptile-apps bot left a comment

greptile-apps bot Mar 7, 2025

greptile-apps bot Mar 7, 2025

greptile-apps bot Mar 7, 2025

greptile-apps bot Mar 7, 2025

greptile-apps bot Mar 7, 2025

greptile-apps bot Mar 7, 2025

rkuo-danswer Mar 8, 2025

rkuo-danswer Mar 8, 2025

Weves Mar 8, 2025

	memory_logger.setLevel(logging.INFO)
	memory_logger.setLevel(logging.INFO)
	memory_logger.propagate = False

		except Exception as e:
		logger.error(f"Error monitoring worker memory: {e}")

Add basic memory logging #4234

Add basic memory logging #4234

Conversation

Weves commented Mar 7, 2025 • edited Loading

Description

How Has This Been Tested?

Backporting (check the box to trigger backport action)

vercel bot commented Mar 7, 2025 • edited Loading

greptile-apps bot left a comment

Choose a reason for hiding this comment

PR Summary

greptile-apps bot Mar 7, 2025

Choose a reason for hiding this comment

greptile-apps bot Mar 7, 2025

Choose a reason for hiding this comment

greptile-apps bot Mar 7, 2025

Choose a reason for hiding this comment

greptile-apps bot Mar 7, 2025

Choose a reason for hiding this comment

greptile-apps bot Mar 7, 2025

Choose a reason for hiding this comment

greptile-apps bot Mar 7, 2025

Choose a reason for hiding this comment

rkuo-danswer Mar 8, 2025

Choose a reason for hiding this comment

rkuo-danswer Mar 8, 2025

Choose a reason for hiding this comment

Weves Mar 8, 2025

Choose a reason for hiding this comment

Weves commented Mar 7, 2025 •

edited

Loading

vercel bot commented Mar 7, 2025 •

edited

Loading