2013-09-06 22 views
7

Rozważmy użytkownika, który potrzebuje tekst dokumentu docx bez nagłówków i stopek do przetwarzania w R.Gdzie znaleźć schemat (.XSD plik) dla Microsoft docx formacie

Jeśli file.docx zostanie zmieniona jako plik .zip i dokument document.xml są analizowane - jest to dobrze sformatowany dokument XML z tekstem.

Czy mikroprocesor (lub inny programista) opublikował schemat dla tego pliku dokumentu xml w pliku ZIP pliku docx?

Plik wygląda następująco:

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> 
- <w:document xmlns:wpc="http://schemas.microsoft.com/office/word/2010/wordprocessingCanvas" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:m="http://schemas.openxmlformats.org/officeDocument/2006/math" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:wp14="http://schemas.microsoft.com/office/word/2010/wordprocessingDrawing" xmlns:wp="http://schemas.openxmlformats.org/drawingml/2006/wordprocessingDrawing" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main" xmlns:w14="http://schemas.microsoft.com/office/word/2010/wordml" xmlns:wpg="http://schemas.microsoft.com/office/word/2010/wordprocessingGroup" xmlns:wpi="http://schemas.microsoft.com/office/word/2010/wordprocessingInk" xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml" xmlns:wps="http://schemas.microsoft.com/office/word/2010/wordprocessingShape" mc:Ignorable="w14 wp14"> 
- <w:body> 
- <w:p w:rsidR="00F447D7" w:rsidRPr="00C63308" w:rsidRDefault="00F447D7"> 
- <w:pPr> 

Odpowiedz

8

Od wikipedia:

Format został początkowo standaryzowany przez ECMA (jako ECMA-376), aw późniejszych wersjach, przez ISO i IEC (zgodnie z ISO/IEC 29500).

można znaleźć różne wersje XSD w ECMA-376 downloads

document.xml zgodny z WordprocessingML części schematów (poszukaj wml.xsd).

+1

Można również przeglądać: http://www.datypic.com/sc/ooxml/s-wml.xsd.html – Orwellophile