<div dir="ltr"><div style>@Joe, thanks for starting this thread, I was just thinking along this line of making sure bird is running.</div><div style><br></div>Apollon, I would love to give your plugin a try. <div><br></div>
<div>To summarize, I'm deploying Bird on 120 machines (2 nic each) + 6 routers (total of 240 ptp links in a clos configuration) and participate in a single area OSPF. Anyone know whether bird have been being deploy/tested in this use case?</div>
<div><br></div><div><br></div><div style>thanks,</div></div><div class="gmail_extra"><br clear="all"><div>-bn<br>0216331C</div>
<br><br><div class="gmail_quote">On Mon, Apr 22, 2013 at 4:35 AM, Apollon Oikonomopoulos <span dir="ltr"><<a href="mailto:apollon@skroutz.gr" target="_blank">apollon@skroutz.gr</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im">On 19:20 Mon 22 Apr     , Joe Wooller wrote:<br>
> On a similar note, does anyone monitor the process externally, (say via nagios or the like?)<br>
> I would be interested to see how people monitor the active process,<br>
> and possibly if anyone monitors sessions and prefixes received, used/filtered?<br>
><br>
> I haven't been able to find any thing out there that suits my needs, so with the assistance of a friend we have come up with this, still in progress though..<br>
><br>
> <a href="https://github.com/dowlingw/bird-tool" target="_blank">https://github.com/dowlingw/bird-tool</a><br>
><br>
> Cheers<br>
> Joe<br>
<br>
</div>We are monitoring the process with icinga & check_mk. Check_mk has a<br>
notion of state, so we essentially persist ("inventorize") the admin<br>
state of all protocols (up/down) and their status (Connected, Running<br>
etc) and if anything changes we get an alert.<br>
<br>
I could share the check_mk plugin that does all this, if anyone is<br>
interested.<br>
<br>
We also monitor the prefix count directly in the Linux kernel (via<br>
/proc/net/fib_triestat and /proc/net/rt6_stats) and use it to score our<br>
keepalived processes higher or lower and possibly trigger a failover of<br>
the access interface IPs if one router seems to receive significantly<br>
less prefixes than the other for some reason.<br>
<br>
Cheers,<br>
Apollon<br>
</blockquote></div><br></div>