PDFのテキスト抽出の順序が文書の見た目と食い違う件

仕事柄、他人様が作った数表のPDFからテキストデータを抜いてエクセル化したりすることが多い。
近年はテキストデータが付いているPDFが一般的になって、仕事が楽になったと思っていたのだが、いまさらながらこの問題に気がついて困っている。
エクセルで表を作成して、エクセルからPDFにした場合でも、表の要素の順序が入れ替わってしまうことが起きるようだ。
エクセルが悪いのか、Acrobatなど読み取り側の問題なのかよくわからない。
当面、文書ごとに逐一データのミスがないかチェックするしかない。
PDFのデータ構造を手っ取り早く理解できる文書ってどこかにないのだろうか。
それにしても、PDFについては規約が緩いのかよくわからないけど、再利用の面ですごく苦労する。Adobeは、だから正直Microsoft以上に嫌いなのだが、誰かビジネスチャンスだと思うので、このあたりの整合性を取れるソフトを作ってください。お願いします。