Nachdem ich ja schon ausgiebig meine Abenteuer mit der T-Com beklagte, musste ich heute ernüchtert feststellen, dass nicht nur die T-Com mich hasst. Nein, auch Cisco mag mich nicht.
Heute Nacht wurde der Access Concentrator in Stuttgart umgetauscht. Früher war ich an STGX42-erx, einer Juniper Networks E-Series, angeschlossen. Mittlerweile ist es ein Cisco 10000 Router mit der Performance Routing Engine 3.
Das Ergebnis ist deutlich:
Mar 13 17:37:29 rtr pppd[19032]: pppd 2.4.3 started by root, uid 0
Mar 13 17:37:29 rtr pppd[19032]: Using interface ppp0
Mar 13 17:37:30 rtr pppd[19032]: Connect: ppp0 <--> /dev/pts/0
Mar 13 17:37:30 rtr pppoe[19035]: PPP session is 63082
Mar 13 17:37:31 rtr pppd[19032]: CHAP authentication succeeded
Mar 13 17:37:31 rtr pppd[19032]: local IP address 91.32.100.35
Mar 13 17:37:31 rtr pppd[19032]: remote IP address 217.0.118.57
Mar 13 17:50:01 rtr pppd[19032]: LCP terminated by peer
Mar 13 17:50:01 rtr pppd[19032]: Connect time 12.5 minutes.
Mar 13 17:50:01 rtr pppoe[19035]: Session 63082 terminated -- received PADT from peer
Mar 13 17:50:01 rtr pppoe[19035]: Sent PADT
Mar 13 17:50:01 rtr pppd[19032]: Sent 39902910 bytes, received 18850825 bytes.
Mar 13 17:50:01 rtr pppd[19032]: Modem hangup
Mar 13 17:50:01 rtr pppd[19032]: Connection terminated.
Mar 13 17:50:02 rtr pppd[19032]: Exit.
Man sieht also sehr schön, wie es eben nicht geht. :-(
Wenn ich das ganze mal etwas über den Tag verteilt beobachte, dann sieht man sehr schön, wie lange die Verbindung hielt, bis es zum Abbruch kam.
Mar 11 17:01:26 rtr pppd[1479]: Connect time 1440.0 minutes.
Mar 11 22:46:15 rtr pppd[4662]: Connect time 344.7 minutes.
Mar 12 03:33:44 rtr pppd[5666]: Connect time 272.8 minutes.
Mar 12 03:46:47 rtr pppd[11582]: Connect time 13.0 minutes.
Mar 13 03:25:42 rtr pppd[11749]: Connect time 1418.9 minutes.
Mar 13 03:42:54 rtr pppd[14825]: Connect time 3.1 minutes.
Mar 13 04:22:02 rtr pppd[14908]: Connect time 39.0 minutes.
Mar 13 04:31:10 rtr pppd[15531]: Connect time 9.0 minutes.
Mar 13 05:13:49 rtr pppd[15627]: Connect time 42.6 minutes.
Mar 13 05:27:27 rtr pppd[15740]: Connect time 13.5 minutes.
Mar 13 06:05:36 rtr pppd[15836]: Connect time 38.1 minutes.
Mar 13 06:17:44 rtr pppd[15962]: Connect time 12.1 minutes.
Mar 13 06:42:22 rtr pppd[16058]: Connect time 24.6 minutes.
Mar 13 07:04:00 rtr pppd[16156]: Connect time 21.6 minutes.
Mar 13 07:31:38 rtr pppd[16267]: Connect time 27.6 minutes.
Mar 13 07:37:46 rtr pppd[16376]: Connect time 6.0 minutes.
Mar 13 09:41:28 rtr pppd[16461]: Connect time 123.6 minutes.
Mar 13 09:49:35 rtr pppd[16656]: Connect time 8.0 minutes.
Mar 13 10:11:14 rtr pppd[16752]: Connect time 21.6 minutes.
Mar 13 10:17:21 rtr pppd[16865]: Connect time 6.0 minutes.
Mar 13 11:00:00 rtr pppd[16961]: Connect time 42.6 minutes.
Mar 13 11:23:08 rtr pppd[17082]: Connect time 23.0 minutes.
Mar 13 11:30:46 rtr pppd[17192]: Connect time 7.5 minutes.
Mar 13 11:42:24 rtr pppd[17288]: Connect time 11.6 minutes.
Mar 13 11:47:01 rtr pppd[17373]: Connect time 4.5 minutes.
Mar 13 12:25:10 rtr pppd[17469]: Connect time 38.1 minutes.
Mar 13 12:47:14 rtr pppd[17595]: Connect time 22.0 minutes.
Mar 13 13:02:52 rtr pppd[17744]: Connect time 15.6 minutes.
Mar 13 13:05:59 rtr pppd[17842]: Connect time 3.0 minutes.
Mar 13 13:49:38 rtr pppd[17925]: Connect time 43.6 minutes.
Mar 13 13:57:46 rtr pppd[18070]: Connect time 8.0 minutes.
Mar 13 14:32:55 rtr pppd[18153]: Connect time 35.1 minutes.
Mar 13 15:16:04 rtr pppd[18277]: Connect time 43.1 minutes.
Mar 13 15:57:43 rtr pppd[18404]: Connect time 41.6 minutes.
Mar 13 16:24:21 rtr pppd[18517]: Connect time 26.6 minutes.
Mar 13 16:32:29 rtr pppd[18629]: Connect time 8.1 minutes.
Mar 13 16:41:06 rtr pppd[18725]: Connect time 8.5 minutes.
Mar 13 17:21:15 rtr pppd[18810]: Connect time 40.1 minutes.
Mar 13 17:37:23 rtr pppd[18934]: Connect time 16.0 minutes.
Mar 13 17:50:01 rtr pppd[19032]: Connect time 12.5 minutes.
Mar 13 18:09:09 rtr pppd[19128]: Connect time 19.1 minutes.
Mar 13 18:35:17 rtr pppd[19227]: Connect time 26.1 minutes.
Nämlich nicht lange.
Bis zum 13. März um 3:25 Uhr ging das gut, ca. 24h Verbindungsdauer, was korrekt ist. Seit 3:25 bewegt sich das zwischen 3 Minuten und 2 Stunden als Maximum.
Danke Cisco. Ihr habt das wirklich drauf.
Die Fehlerquelle Modem und Leitung scheidet nach eigener Fehlersuche aus. Die Leitungsdämpfung ist unverändert gut mit 27.5db Downstream und 20.0db Upstream. Wichtig ist der Rauschabstand, welcher mit 16.5db Downstream und 15.0db Upstream auch gut genug ist.
Interessant ist hierbei nur, dass die Leitungsdämpfung vorher ein wenig geringer war, nämlich 25.0db Downstream und 19.0db Upstream, aber das macht nichts weiter aus, da die Leitung weiterhin gut in den Grenzen für T-DSL 3000 liegt.
Das einzige Problem könnte das abgeschaltete Interleaving, die "proaktive Fehlerkorrektur" sein. Diese dürfte den meisten unter dem Namen "FastPath" bekannt sein und deren Bestellung gestaltete sich ein wenig schwierig.
Aber auch hier Fehlanzeige. Keinerlei CRC oder sonstige Fehler auf der Leitung, und die T-DSL Verbindung selber (also "der Sync") hat auch eine Uptime von 5h gehabt nachdem ich das Modem gegen Mittag neu gestartet hatte.
Die Fehlermeldung oben spricht eigentlich auch eine deutliche Sprache. Das PADT Paket, also ein PPPoE Active Discovery Termination Paket, bedeutet dass eine Seite die Verbindung beenden möchte.
In diesem Fall ist das die Gegenstelle, also die Cisco 10k.
Insofern liegt die Vermutung nahe, dass die in Stuttgart verbaute Cisco 10000 mit der Bezeichnung STGC05-10k einfach einen IOS Bug hat.
Die von DENOG Kollegen geäusserten Bemerkungen waren dementsprechend gehässig und ließen sehr vermuten, dass obiges Problem kein Einzelfall ist.
Ein entsprechender Störungsfall ist natürlich aufgemacht worden. Leider sind die Techniker jedoch Telefontechniker, die die Teilnehmeranschlussleitung auch mehrfach und gerne durchmessen nur um festzustellen dass die Leitung ganz exzellent ist und er auch keine Ahnung hat. Wenn man den Techniker dann auf den Tausch der Juniper gegen die Cisco Maschine anspricht, dann sind sie erst verdutzt, schauen in ihrem Ticket-System nach und sind dann hilflos.
Zitat: "Ähhh. Da haben Sie wohl mehr Ahnung von als ich. Ich wusste nicht einmal, dass da was geändert wurde. Hmh. Was machen wir denn jetzt?"
Na toll!
Gute Frage. Ich werde also morgen mal mit dem Techniker ausgiebig reden, weil sein Vorschlag mich auf einen anderen DSLAM umzustecken dürfte leider nicht von Erfolg gekrönt sein, liegt das Problem doch hinter dem DSLAM und auch auf einer anderen Netzwerkebene. Und der Techniker kennt halt nur das Physical Layer, nix weiter oben im OSI Modell.
Aber mal schauen, vielleicht kann er ja mal mit seinen Kollegen vom IP Bereich reden, wenn ich ihn dann erst einmal in meinen Klauen habe wenn er dann vorbeikommt.