Înlocuiți pauza de linie „Shift-Enter” cu „Enter” în documentul Word folosind Microsoft Office API (Programare, Api, Ms Word, Ms Office, Pauze De Linie)

Kata a intrebat.

Am un număr de documente Word care vor fi convertite în HTML. Este necesar ca paragrafele din documentele word să fie convertite în <p> elemente.

După câteva teste cu metoda SaveAs din Microsoft Office API pentru a converti documentele în HTML, mi-am dat seama că paragrafele cu întreruperi de linie manuale (întrerupere cu „Shift-Enter”) nu pot fi plasate într-un element separat. <p> element, în schimb, paragrafele sunt grupate în același element <p> element.

Pentru a le separa, am încercat să înlocuiesc întreruperile de linie „Shift-Enter” cu „Enter”/Carriage return înainte de a face conversia. Cu toate acestea, nu am putut găsi o modalitate adecvată de a efectua înlocuirea întreruperilor de linie. Am încercat parametrul WdLineEndingType în metoda SaveAs, dar se pare că nu este eficient pentru această problemă.

3 răspunsuri
Alan Campbell

Pentru cei care caută în MS Word: utilizați Control-H {Find & replace].

Găsiți Caracter special: Manual Line break (^l, L minuscul)

Înlocuiți cu: Semn de paragraf (^p)

Replace All (Înlocuiește tot) va face tot documentul.

Editați: schimbat în caractere minuscule.

Comentarii

  • Nu este minusculă ^l și ^p? –  > Por d.b.
  • @d.b Se pare că –  > Por Donpedro.
Kata

API-ul ms-word office oferă o funcție de căutare în obiectul Range, care permite căutarea și înlocuirea șirurilor de caractere.

Următorul cod are ca scop găsirea întreruperilor de linie manuale(„^l”) cu revenirea la cărucior(„^p”).

Range r = oDoc.Content;
r.WholeStory();
r.Find.Execute("^l", ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing, "^p", WdReplace.wdReplaceAll);

Apoi, utilizați SaveAs pentru a converti documentul Word în HTML, care va plasa corect fiecare linie în <p> elemente.

Pradeep

Marca de paragraf ( Marca de paragraf )

^p (nu funcționează în căsuța Find what (Găsește ce) atunci când opțiunea Use wildcards (Folosește wildcards) este activată), sau ^13