5
file.htmlHTML Tidy stripping przestrzeń na początku
word<i><span> <span>ratti</span></span></i>
poleceń
Wyjście
word<i>ratti</i>
Pożądany wyjście
word<i> ratti</i>
Gdzie jest miejsce?
Log
line 1 column 1 - Warning: missing <!DOCTYPE> declaration line 1 column 1 - Warning: plain text isn't allowed in <head> elements line 1 column 8 - Warning: <span> is probably intended as </span> line 1 column 5 - Warning: replacing unexpected span by </span> line 1 column 33 - Warning: discarding unexpected </span> line 1 column 40 - Warning: discarding unexpected </i> line 1 column 1 - Warning: inserting missing 'title' element line 1 column 8 - Warning: trimming empty <span> Info: Document content looks like HTML 4.01 Transitional 8 warnings, 0 errors were found! <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <meta name="generator" content= "HTML Tidy for Linux/x86 (vers 1st November 2003), see www.w3.org"> <title></title> </head> <body> word<i>ratti</i> </body> </html>
Wygląda na to, że trzeba go odrzucić, czy próbowałeś nierozerwalnej przestrzeni ? –
Nie mogę nic zrobić z HTML, to tylko próbka pliku 10K + linii, a są tysiące takich plików, nie mogę edytować ich HTML. W takim przypadku powinna być opcja 'tidy', aby zachować przestrzenie. BTW, aby odpowiedzieć na twoje pytanie, tak to działa dobrze z –
Możesz wypróbować tę opcję --add-xml-space tak –