Простой парсер таблицы в массив из HTML

Задача: необходимо преобразовать страницу HTML, в которой данные размещены в виде стандартной таблицы обрамленной тегами <table></table>, в двумерный массив на PHP (парсер таблицы в массив).

Сначала я хотел решить задачу «в лоб», а именно искать теги в тексте, писать функционал по вычленению данных между тегами.. Но потом подумал, что «наверное всё уже придумано до нас», для подобных задач. Ну и собственно оказался прав. Задачу решил без лишних усилий в течении минут 5.

Решение: воспользуюсь PHP функцией DOMDocument для того чтобы преобразовать текст в DOM объект:

Так я получаю построенное DOM дерево. Затем получаю все «ветки» по имени tr, и перебираю их, одновременно перебирая «всех листья» (т.е. тэги td):

Данные я передал в двухмерный массив $mass, т.е. задача «парсер таблицы в массив» решена

парсер таблицы в массив через построение DOM

Ну а тут ссылка на подобную же задачу, но вместо HTML документа — файл формата XML

Calc не работает курсор клавиатуры

Ну на самом деле работает, вот только OpenOffice смотрит состояние клавиши ScrollLock по индикатору на клавиатуре. А в KDE (возможно и в GNOME), по умолчанию этот индикатор «гасится» (чтоб не блазнило видимо) и лампочка на клавиатуре не горит, вне зависимости от состояния кнопки (видимо состояние отслеживается софтово).

Решение: вернуть взад индикацию клавиатуры

P.S. Этот «баг» тянется уже несколько лет, от которого страдают обычные пользователи, и создается негатив. А жаль.




JQuery tablesorter не правильно сортирует число

Казалось бы, что тут такого? В таблице строго число, разделенное точкой, а сортирует.. Какие-то колонки нормально, какие-то не пойми как. Проблема решается только если четко сказать плагину, какие колонки числа. Например так: