keventd - Oops: kernel access of bad area

Beitrag von **Z80** » Mittwoch 18. Mai 2005, 11:27

es kommt seit einiger zeit immer mal wieder zum abschmieren des keventd(?). passiert meist bei schneller tastenfolge der ferbedienung, z.b. umschalten zwischen zweier sendungen, verlassen des movieplayers durch mehrfaches drücken auf die "home"-taste.

die fernbedienung ist anschliessend komplett tod.
telnet/inetd/httpd/controld etc. laufen aber weiter; box ist auch z.b. mittels rcsim weiterhin zu bedienbar.

Code: Alles auswählen

PES, queue 0 normal.
[controld] VIDEO_EVENT_SIZE_CHANGED 720x576 (16:9 -> 4:3)
Oops: kernel access of bad area, sig: 11
NIP: C38974B8 XER: 00000000 LR: C38974B0 SP: C01E3EF0 REGS: c01e3e40 TRAP: 0300 
   Not tainted
MSR: 00009032 EE: 1 PR: 0 FP: 0 ME: 1 IR/DR: 11
DAR: 00000000, DSISR: C0000000
TASK = c01e2000[2] 'keventd' Last syscall: -1 
last math 00000000 last altivec 00000000
GPR00: C38974B0 C01E3EF0 C01E2000 00000001 00001032 00000067 C01E3EF9 00000000 
GPR08: C01E2000 00000000 00000000 C014AD50 84244082 100FB630 01FFBB00 00000001 
GPR16: FFFFFFFF 007FFF00 01FF6124 00000000 00000001 C0120000 C0120000 C0120000 
GPR24: C0120000 C01E23A8 C38A0000 C38A0000 C3890000 C3898028 C3898014 C3897F74 
Call backtrace: 
C38974B0 C3893B8C C3893BC8 C00147C0 C001BB30 C0004D1C 
PCR discontinuity: PCR: 0x0BF657597, OLDPCR: 0x0BF648012, Diff: 62853

[sectionsd] readNbytes: received POLLERR

Code: Alles auswählen

> ps -ef
  PID  Uid     VmSize Stat Command
    1 root        500 S   init
    2 root            Z   [keventd]
    3 root            SWN [ksoftirqd_CPU0]
    4 root            SW  [kswapd]
    5 root            SW  [bdflush]
    6 root            SW  [kupdated]
    7 root            SW  [mtdblockd]
    9 root        500 S   init
   10 root        468 S   /bin/sh /etc/init.d/rcS
   13 root            SWN [jffs2_gcd_mtd3]
   23 root        548 S   /sbin/inetd
   33 root        736 S   /bin/tuxmaild
   36 root        736 S   /bin/tuxmaild
   37 root        736 S   /bin/tuxmaild
   56 root            SW  [avia_av_wdt]
   60 root            SW  [avia_gt_wdt]
   77 root        476 S   /bin/sh /var/tuxbox/start_neutrino
   99 root       6428 S   /bin/sectionsd
  101 root       6428 S   /bin/sectionsd
  102 root       6428 S   /bin/sectionsd
  103 root       6428 S   /bin/sectionsd
  104 root       6428 S   /bin/sectionsd
  105 root       6428 S   /bin/sectionsd
  106 root       1164 S   /bin/timerd
  108 root       1164 S   /bin/timerd
  109 root       1164 S   /bin/timerd
  115 root       1652 S   /bin/zapit -u
  121 root       1192 S   /bin/controld
  123 root       1192 S   /bin/controld
  124 root       1192 S   /bin/controld
  125 root       1432 S   /bin/nhttpd
  127 root       5532 S   /bin/neutrino -u -f
  133 root       1432 S   /bin/nhttpd
  135 root       5532 S   /bin/neutrino -u -f
  136 root       5532 S   /bin/neutrino -u -f
  146 root            SW  [rpciod]
  332 root        996 S   /var/bin/camd2
  334 root        996 S   /var/bin/camd2
  411 root            SW  [kdvb-fe-0:0]
  413 root        376 S   telnetd
  414 root        612 S   -sh
  440 root        556 R   ps -ef

Beitrag von **Npq** » Mittwoch 18. Mai 2005, 12:20

Hmm, dann passiert da was im FP-Interrupt-Handler ("fp_task(void *arg)").

Ohne Symboltabelle kann ich dir nicht sagen wo es genau passiert aber in der Funktion wird normalerweise ausgelesen was für Daten angekommen sind. Würde sich dann ja mit den Tastendrücken decken.

Da's allerdings wohl nur bei dir auftritt ist es evtl. ein Hinweis auf einen beginnenden Defekt des FP?

Beitrag von **MOhlmann** » Mittwoch 18. Mai 2005, 12:29

Hi

Da's allerdings wohl nur bei dir auftritt ist es evtl. ein Hinweis auf einen beginnenden Defekt des FP?

Das währe nartürlich schlecht. Ich habe das bei mir auch fesgestellt, das die box sein ein paat tagen mit dieser meldung schon ein paar mal hängen geblieben ist. Ich habe leider das log nicht mehr, da ich was am probieren war und dachte das ich den fehler verursacht hab.

Gruß Michael

Beitrag von **petgun** » Mittwoch 18. Mai 2005, 12:56

Npq hat geschrieben:Da's allerdings wohl nur bei dir auftritt ist es evtl. ein Hinweis auf einen beginnenden Defekt des FP?

tritt bei mir auch schon mal auf...der FP der Box ist aber imo nicht defekt oder gibt langsam seinen Geist auf.

Beitrag von **zexma** » Mittwoch 18. Mai 2005, 18:53

Das kann ich auch bestätigen. Der Fehler hat sich wohl irgendwann letztes Jahr eingeschlichen. Hatte es glaub' ich auch schonmal gepostet. Vorher gabs das Problem bei mir nämlich nicht.

Mir scheint, dass es bei den Nokias seltener auftritt.

Beitrag von **Nico 77** » Mittwoch 18. Mai 2005, 19:11

Genau das Prob habe ich auch alle paar Wochen, Monate.

Genau die gleiche Fehlermeldung.

Beitrag von **Npq** » Mittwoch 18. Mai 2005, 20:21

Ihr seid euch aber sicher, daß immer der "keventd" der aktuelle Task war als der Oops passierte?

Weil, das ist eigentlich das wesentliche in diesem Fall.

Hmm, @z80, du könntest auf der Box (mit genau dem gleichen Image wie beim Oops!) bitte mal ein

Code: Alles auswählen

cat /proc/ksyms | grep "fp_"

ausführen und die Werte hier posten.

Der Oops muß dabei nicht aufgetreten sein und es ist auch egal, ob Neutrino/Enigma oder was auch immer läuft. Nur die Kernelmodule müssen geladen sein.

Beitrag von **Z80** » Mittwoch 18. Mai 2005, 23:43

gerne.
(jtg-image, philips box)

Code: Alles auswählen

~ > cat /proc/ksyms | grep "fp_"
c38ab50c dbox2_fp_napi_exit     [dbox2_fp_napi]
c38ab4bc dbox2_fp_napi_init     [dbox2_fp_napi]
c38978ac dbox2_fp_keyboard_exit [dbox2_fp_input]
c38970f0 dbox2_fp_input_exit    [dbox2_fp_input]
c3897ea0 dbox2_fp_mouse_exit    [dbox2_fp_input]
c3897a58 dbox2_fp_button_exit   [dbox2_fp_input]
c38977c8 dbox2_fp_keyboard_init [dbox2_fp_input]
c38975ec dbox2_fp_rc_exit       [dbox2_fp_input]
c3897060 dbox2_fp_input_init    [dbox2_fp_input]
c38979b4 dbox2_fp_button_init   [dbox2_fp_input]
c3897520 dbox2_fp_rc_init       [dbox2_fp_input]
c3897e18 dbox2_fp_mouse_init    [dbox2_fp_input]
c3898330 mid    [dbox2_fp_input]
c38939f8 dbox2_fp_queue_alloc   [dbox2_fp]
c3893a38 dbox2_fp_queue_free    [dbox2_fp]
c3893070 fp_cmd [dbox2_fp]
c3893174 fp_sendcmd     [dbox2_fp]
c3893060 fp_get_i2c     [dbox2_fp]
c3893e84 dbox2_fp_sec_diseqc_cmd        [dbox2_fp]
c3893e78 dbox2_fp_sec_get_status        [dbox2_fp]
c389419c dbox2_fp_sec_set_high_voltage  [dbox2_fp]
c3894140 dbox2_fp_sec_set_power [dbox2_fp]
c3894178 dbox2_fp_sec_set_tone  [dbox2_fp]
c389415c dbox2_fp_sec_set_voltage       [dbox2_fp]
c3894454 dbox2_fp_tuner_write_qam       [dbox2_fp]
c38944f4 dbox2_fp_tuner_write_qpsk      [dbox2_fp]
c38946fc dbox2_fp_reset [dbox2_fp]
c389466c dbox2_fp_reset_cam     [dbox2_fp]
c00b342c scm_fp_dup

Beitrag von **Nico 77** » Mittwoch 18. Mai 2005, 23:59

Npq hat geschrieben:Ihr seid euch aber sicher, daß immer der "keventd" der aktuelle Task war als der Oops passierte?

Weil, das ist eigentlich das wesentliche in diesem Fall.

Ja sicher, passiert genauso wie z80 oben beschrieben.
Philips FB zuviele Tasten zu schnell hintereinander und schwupp der gleiche Kernel Oops.

Beitrag von **Npq** » Freitag 20. Mai 2005, 00:53

Ok, danke, ist kein Hardwaredefekt, sondern ein Bug im RC-Handler.

Aber ich weiß nicht wann ich dazu komme, den zu suchen. Ich schau' mal.

Beitrag von **Nico 77** » Freitag 20. Mai 2005, 01:06

Super.

Beitrag von **zexma** » Freitag 20. Mai 2005, 09:49

Npq hat geschrieben:Ok, danke, ist kein Hardwaredefekt, sondern ein Bug im RC-Handler.
Aber ich weiß nicht wann ich dazu komme, den zu suchen. Ich schau' mal.

Beitrag von **Z80** » Freitag 20. Mai 2005, 11:53

danke Npq,
ist das hier etwa schon ein bugfix

http://cvs.tuxbox-cvs.sourceforge.net/l ... 00139.html

carjay 05/05/20 02:28:49

Modified: fp dbox2_fp_rc.c
Log:
Fix for race condition:
Timer might expire right after timer_pending is checked, so we have to
check the pointer.

Beitrag von **Npq** » Freitag 27. Mai 2005, 20:24

Äh, ja, das könnte/sollte es gewesen sein.

Einfach mal testen (müßte ja mittlerweile in die Images eingezogen sein).