Есть файл в каком -то формате Word 97-2007, Excel 97-2007, OpenOffice, html.
Файлов будет ~10000 в год, источники разнообразны, поэтому разнообразие форматов обеспечено.
Все файлы содержат таблицы (возможно еще какое то бла бла, но интересны только таблицы).
Конвертер должен уметь выцеплять таблицу из исходника, определять в ней нужные столбцы, и заносить это в .txt c фиксированной длиной полей (или .dbf).
Задача определения столбцов.
Хотя с поставщику исходников диктуется определенный формат заполнения таблиц, реальный исполнитель может расположить данные в ином порядке, вставить столбец с ненужными данными, пропустить нужные (ну в этом случае, конечно просто надо оставить пустое место в соотв. поле выходного файла). Т.е. надо как то показать конвертеру, в каком столбце какие данные.
Задача разбора строки.
Реальный составитель исходника может также слить воедино данные, которые предполагалось иметь в разных столбцах. (Пример: адрес (район, н.п., улица, дом, квартира) могут быть слиты все поля, а могут только последние три или четыре - последние три поля не всегда могут быть; ФИО- тоже сливают вместе, тут проще, поделить по пробелу).
Могут ли уважаемые участники форума порекомендовать: способы написания продукта / место, где про это хорошо написано / готовый продукт / иные способы решения задачи.