archerli
diff --git a/‎arangod/GeneralServer/RequestLane.h
Lines changed: 5 additions & 1 deletion b/‎arangod/GeneralServer/RequestLane.h
Lines changed: 5 additions & 1 deletion
diff --git a/‎arangod/Scheduler/SchedulerFeature.h
Lines changed: 3 additions & 4 deletions b/‎arangod/Scheduler/SchedulerFeature.h
Lines changed: 3 additions & 4 deletions
diff --git a/‎arangod/Scheduler/SupervisedScheduler.cpp
Lines changed: 76 additions & 54 deletions b/‎arangod/Scheduler/SupervisedScheduler.cpp
Lines changed: 76 additions & 54 deletions
diff --git a/‎arangod/Scheduler/SupervisedScheduler.h
Lines changed: 4 additions & 2 deletions b/‎arangod/Scheduler/SupervisedScheduler.h
Lines changed: 4 additions & 2 deletions
@@ -98,7 +98,11 @@ enum class RequestLane {
   // AGENCY_CALLBACK`
 };
 
-enum class RequestPriority { HIGH, MED, LOW };
+enum class RequestPriority { 
+  HIGH = 0, 
+  MED = 1, 
+  LOW = 2 
+};
 
 inline RequestPriority PriorityRequestLane(RequestLane lane) {
   switch (lane) {
 
@@ -48,18 +48,17 @@ class SchedulerFeature final : public application_features::ApplicationFeature {
  private:
   uint64_t _nrMinimalThreads = 2;
   uint64_t _nrMaximalThreads = 0;
-  uint64_t _queueSize = 128;
-  uint64_t _fifo1Size = 1024 * 1024;
+  uint64_t _queueSize = 4096;
+  uint64_t _fifo1Size = 4096;
   uint64_t _fifo2Size = 4096;
 
   std::unique_ptr<Scheduler> _scheduler;
 
   // -------------------------------------------------------------------------
-  // UNRELATED SECTION STARS HERE: Singals and other things creeped into Sched
+  // UNRELATED SECTION STARTS HERE: Signals and other things crept into Sched
   // -------------------------------------------------------------------------
 
  public:
-  /*size_t concurrency() const { return static_cast<size_t>(_nrMaximalThreads); }*/
   void buildControlCHandler();
   void buildHangupHandler();
 
 
@@ -68,7 +68,7 @@ bool isDirectDeadlockLane(RequestLane lane) {
 namespace {
 typedef std::chrono::time_point<std::chrono::steady_clock> time_point;
 
-// value initialise these arrays, otherwise mac will crash
+// value-initialize these arrays, otherwise mac will crash
 thread_local time_point conditionQueueFullSince{};
 thread_local uint_fast32_t queueWarningTick{};
 
@@ -80,7 +80,7 @@ time_point lastQueueFullWarning[3];
 int64_t fullQueueEvents[3] = {0, 0, 0};
 std::mutex fullQueueWarningMutex[3];
 
-void logQueueWarningEveryNowAndThen(int64_t events) {
+void logQueueWarningEveryNowAndThen(int64_t events, uint64_t maxQueueSize) {
   auto const now = std::chrono::steady_clock::now();
   uint64_t totalEvents;
   bool printLog = false;
@@ -99,13 +99,13 @@ void logQueueWarningEveryNowAndThen(int64_t events) {
 
   if (printLog) {
     LOG_TOPIC("dead2", WARN, Logger::THREADS)
-        << "Scheduler queue"
+        << "Scheduler queue with max capacity " << maxQueueSize
         << " is filled more than 50% in last " << sinceLast.count()
-        << "s. (happened " << totalEvents << " times since last message)";
+        << "s (happened " << totalEvents << " times since last message)";
   }
 }
 
-void logQueueFullEveryNowAndThen(int64_t fifo) {
+void logQueueFullEveryNowAndThen(int64_t fifo, uint64_t maxQueueSize) {
   auto const& now = std::chrono::steady_clock::now();
   uint64_t events;
   bool printLog = false;
@@ -122,7 +122,8 @@ void logQueueFullEveryNowAndThen(int64_t fifo) {
 
   if (printLog) {
     LOG_TOPIC("dead1", WARN, Logger::THREADS)
-        << "Scheduler queue " << fifo << " is full. (happened " << events
+        << "Scheduler queue " << fifo << " with max capacity " << maxQueueSize
+        << " is full (happened " << events
         << " times since last message)";
   }
 }
@@ -153,7 +154,7 @@ class SupervisedSchedulerWorkerThread final : public SupervisedSchedulerThread {
   explicit SupervisedSchedulerWorkerThread(SupervisedScheduler& scheduler)
       : Thread("SchedWorker"), SupervisedSchedulerThread(scheduler) {}
   ~SupervisedSchedulerWorkerThread() { shutdown(); }
-  void run() override { _scheduler.runWorker(); };
+  void run() override { _scheduler.runWorker(); }
 };
 
 }  // namespace arangodb
@@ -172,69 +173,92 @@ SupervisedScheduler::SupervisedScheduler(uint64_t minThreads, uint64_t maxThread
       _definitiveWakeupTime_ns(100000),
       _maxNumWorker(maxThreads),
       _numIdleWorker(minThreads),
-      _maxFifoSize(maxQueueSize) {
-  _queue[0].reserve(maxQueueSize);
-  _queue[1].reserve(fifo1Size);
-  _queue[2].reserve(fifo2Size);
+      _maxFifoSize(maxQueueSize),
+      _fifo1Size(fifo1Size),
+      _fifo2Size(fifo2Size) {
+  _queues[0].reserve(maxQueueSize);
+  _queues[1].reserve(fifo1Size);
+  _queues[2].reserve(fifo2Size);
 }
 
 SupervisedScheduler::~SupervisedScheduler() {}
 
 bool SupervisedScheduler::queue(RequestLane lane, std::function<void()> handler,
                                 bool allowDirectHandling) {
-  if (!isDirectDeadlockLane(lane) && allowDirectHandling &&
-      !ServerState::instance()->isClusterRole() && (_jobsSubmitted - _jobsDone) < 2) {
-    _jobsSubmitted.fetch_add(1, std::memory_order_relaxed);
-    _jobsDequeued.fetch_add(1, std::memory_order_relaxed);
-    _jobsDirectExec.fetch_add(1, std::memory_order_release);
-    try {
-      handler();
-      _jobsDone.fetch_add(1, std::memory_order_release);
-      return true;
-    } catch (...) {
-      _jobsDone.fetch_add(1, std::memory_order_release);
-      throw;
+  if (!isDirectDeadlockLane(lane) && 
+      allowDirectHandling &&
+      !ServerState::instance()->isClusterRole()) {
+    uint64_t const jobsDone = _jobsDone.load(std::memory_order_acquire);
+    uint64_t const jobsSubmitted = _jobsSubmitted.load(std::memory_order_relaxed);
+    if (jobsSubmitted - jobsDone < 2) {
+      _jobsSubmitted.fetch_add(1, std::memory_order_relaxed);
+      _jobsDequeued.fetch_add(1, std::memory_order_relaxed);
+      _jobsDirectExec.fetch_add(1, std::memory_order_relaxed);
+      try {
+        handler();
+        _jobsDone.fetch_add(1, std::memory_order_release);
+        return true;
+      } catch (...) {
+        _jobsDone.fetch_add(1, std::memory_order_release);
+        throw;
+      }
     }
   }
-
-  size_t queueNo = static_cast<size_t>(PriorityRequestLane(lane));
+  
+  auto work = std::make_unique<WorkItem>(std::move(handler));
+  
+  // use memory order acquire to make sure, pushed item is visible
+  uint64_t const jobsDone = _jobsDone.load(std::memory_order_acquire);
+  uint64_t const jobsSubmitted = _jobsSubmitted.fetch_add(1, std::memory_order_relaxed);
+  
+  // to make sure the queue length hasn't underflowed
+  TRI_ASSERT(jobsDone <= jobsSubmitted);
+
+  uint64_t const approxQueueLength = jobsSubmitted - jobsDone;
+  
+  size_t const queueNo = static_cast<size_t>(PriorityRequestLane(lane));
 
   TRI_ASSERT(queueNo <= 2);
   TRI_ASSERT(isStopping() == false);
 
-  auto work = std::make_unique<WorkItem>(std::move(handler));
+  if (!_queues[queueNo].bounded_push(work.get())) {
+    _jobsSubmitted.fetch_sub(1, std::memory_order_release);
 
-  if (!_queue[queueNo].push(work.get())) {
-    logQueueFullEveryNowAndThen(queueNo);
+    uint64_t maxSize = _maxFifoSize;
+    if (queueNo == 1) {
+      maxSize = _fifo1Size;
+    } else if (queueNo == 2) {
+      maxSize = _fifo2Size;
+    }
+    LOG_TOPIC("98d94", DEBUG, Logger::THREADS) << "unable to push job to scheduler queue: queue is full";
+    logQueueFullEveryNowAndThen(queueNo, maxSize);
     return false;
   }
+
   // queue now has ownership for the WorkItem
   work.release();
 
-  static thread_local uint64_t lastSubmitTime_ns;
+  static thread_local uint64_t lastSubmitTime_ns = 0;
 
-  // use memory order release to make sure, pushed item is visible
-  uint64_t jobsSubmitted = _jobsSubmitted.fetch_add(1, std::memory_order_release);
-  uint64_t approxQueueLength = jobsSubmitted - _jobsDone;
   uint64_t now_ns = getTickCount_ns();
   uint64_t sleepyTime_ns = now_ns - lastSubmitTime_ns;
   lastSubmitTime_ns = now_ns;
 
   if (approxQueueLength > _maxFifoSize / 2) {
-    if ((queueWarningTick++ & 0xFF) == 0) {
+    if ((::queueWarningTick++ & 0xFF) == 0) {
       auto const& now = std::chrono::steady_clock::now();
-      if (conditionQueueFullSince == time_point{}) {
-        logQueueWarningEveryNowAndThen(queueWarningTick);
-        conditionQueueFullSince = now;
-      } else if (now - conditionQueueFullSince > std::chrono::seconds(5)) {
-        logQueueWarningEveryNowAndThen(queueWarningTick);
-        queueWarningTick = 0;
-        conditionQueueFullSince = now;
+      if (::conditionQueueFullSince == time_point{}) {
+        logQueueWarningEveryNowAndThen(::queueWarningTick, _maxFifoSize);
+        ::conditionQueueFullSince = now;
+      } else if (now - ::conditionQueueFullSince > std::chrono::seconds(5)) {
+        logQueueWarningEveryNowAndThen(::queueWarningTick, _maxFifoSize);
+        ::queueWarningTick = 0;
+        ::conditionQueueFullSince = now;
       }
     }
   } else {
-    queueWarningTick = 0;
-    conditionQueueFullSince = time_point{};
+    ::queueWarningTick = 0;
+    ::conditionQueueFullSince = time_point{};
   }
 
   bool doNotify = false;
@@ -263,9 +287,6 @@ bool SupervisedScheduler::start() {
 }
 
 void SupervisedScheduler::shutdown() {
-  // THIS IS WHAT WE SHOULD AIM FOR, BUT NOBODY CARES
-  // TRI_ASSERT(_jobsSubmitted <= _jobsDone);
-
   {
     std::unique_lock<std::mutex> guard(_mutex);
     _stopping = true;
@@ -275,8 +296,8 @@ void SupervisedScheduler::shutdown() {
   Scheduler::shutdown();
 
   while (true) {
-    auto jobsSubmitted = _jobsSubmitted.load();
-    auto jobsDone = _jobsDone.load();
+    auto jobsDone = _jobsDone.load(std::memory_order_acquire);
+    auto jobsSubmitted = _jobsSubmitted.load(std::memory_order_relaxed);
 
     if (jobsSubmitted <= jobsDone) {
       break;
@@ -344,7 +365,7 @@ void SupervisedScheduler::runWorker() {
         break;
       }
 
-   
F438
   _jobsDequeued++;
+      _jobsDequeued.fetch_add(1, std::memory_order_relaxed);
 
       state->_lastJobStarted = clock::now();
       state->_working = true;
@@ -372,8 +393,8 @@ void SupervisedScheduler::runSupervisor() {
 
   while (!_stopping) {
     uint64_t jobsDone = _jobsDone.load(std::memory_order_acquire);
-    uint64_t jobsSubmitted = _jobsSubmitted.load(std::memory_order_acquire);
-    uint64_t jobsDequeued = _jobsDequeued.load(std::memory_order_acquire);
+    uint64_t jobsSubmitted = _jobsSubmitted.load(std::memory_order_relaxed);
+    uint64_t jobsDequeued = _jobsDequeued.load(std::memory_order_relaxed);
 
     if (jobsDone == lastJobsDone && (jobsDequeued < jobsSubmitted)) {
       jobsStallingTick++;
@@ -485,8 +506,9 @@ bool SupervisedScheduler::canPullFromQueue(uint64_t queueIndex) const {
   // then a job gets done fast (eg dequeued++, done++)
   // and then we read done.
   uint64_t jobsDone = _jobsDone.load(std::memory_order_acquire);
-  uint64_t jobsDequeued = _jobsDequeued.load(std::memory_order_acquire);
+  uint64_t jobsDequeued = _jobsDequeued.load(std::memory_order_relaxed);
   TRI_ASSERT(jobsDequeued >= jobsDone);
+
   switch (queueIndex) {
     case 0:
       // We can always! pull from high priority
@@ -511,7 +533,7 @@ std::unique_ptr<SupervisedScheduler::WorkItem> SupervisedScheduler::getWork(
       auto queueIdx = triesCount % 3;
       // Order of this if is important! First check if we are allowed to pull,
       // then really pull from queue
-      if (canPullFromQueue(queueIdx) && _queue[queueIdx].pop(work)) {
+      if (canPullFromQueue(queueIdx) && _queues[queueIdx].pop(work)) {
         return std::unique_ptr<WorkItem>(work);
       }
 
@@ -537,7 +559,7 @@ std::unique_ptr<SupervisedScheduler::WorkItem> SupervisedScheduler::getWork(
 void SupervisedScheduler::startOneThread() {
   // TRI_ASSERT(_numWorkers < _maxNumWorker);
   if (_numWorkers + _abandonedWorkerStates.size() >= _maxNumWorker) {
-    return;  // do not add more threads, than maximum allows
+    return;  // do not add more threads than maximum allows
   }
 
   std::unique_lock<std::mutex> guard(_mutexSupervisor);
@@ -622,7 +644,7 @@ Scheduler::QueueStatistics SupervisedScheduler::queueStatistics() const {
   uint64_t const numWorkers = _numWorkers.load(std::memory_order_relaxed);
 
   // read _jobsDone first, so the differences of the counters cannot get negative
-  uint64_t const jobsDone = _jobsDone.load(std::memory_order_relaxed);
+  uint64_t const jobsDone = _jobsDone.load(std::memory_order_acquire);
   uint64_t const jobsDequeued = _jobsDequeued.load(std::memory_order_relaxed);
   uint64_t const jobsSubmitted = _jobsSubmitted.load(std::memory_order_relaxed);
 
 
@@ -77,7 +77,7 @@ class SupervisedScheduler final : public Scheduler {
 
   // Since the lockfree queue can only handle PODs, one has to wrap lambdas
   // in a container class and store pointers. -- Maybe there is a better way?
-  boost::lockfree::queue<WorkItem*> _queue[3];
+  boost::lockfree::queue<WorkItem*> _queues[3];
 
   // aligning required to prevent false sharing - assumes cache line size is 64
   alignas(64) std::atomic<uint64_t> _jobsSubmitted;
@@ -144,7 +144,9 @@ class SupervisedScheduler final : public Scheduler {
   std::condition_variable _conditionSupervisor;
   std::unique_ptr<SupervisedSchedulerManagerThread> _manager;
 
-  size_t _maxFifoSize;
+  uint64_t const _maxFifoSize;
+  uint64_t const _fifo1Size;
+  uint64_t const _fifo2Size;
 
   std::unique_ptr<WorkItem> getWork(std::shared_ptr<WorkerState>& state);