WikiDer > Көмек: Экспорт - Википедия

Help:Export - Wikipedia

Уики-парақтарды арнайы түрде экспорттауға болады XML форматты импорт мысалы, басқа MediaWiki қондырғысына қосыңыз немесе оны басқаша пайдаланыңыз, мысалы, мазмұнды талдау үшін. Сондай-ақ қараңыз m: синдикат арналары беттерден басқа барлық басқа ақпаратты экспорттауға арналған және қараңыз Анықтама: импорттау беттерді импорттау кезінде.

Қалай экспорттауға болады

Беттерді экспорттаудың кем дегенде алты әдісі бар:

  • Мақалалардың атауын жолға салыңыз Арнайы: Экспорт немесе пайдалану https://kk.wikipedia.org/wiki/Special:Export/FULLPAGENAME.
  • Пайдаланыңыз әрекет = шикі. (Бұл парақтың тек викитекстін алады, ал төменде сипатталған XML пішімін емес.) Мысалы: https://kk.wikipedia.org/w/index.php?title=Wikipedia&action=raw .. пайдалану өте маңызды /w/index.php?title=PAGENAME&action=raw және емес / wiki / PAGENAME? action = raw (қараңыз Phab T126183)
  • XML немесе JSON қаптамасындағы деректерді алу үшін API қолданыңыз
  • Қосымша сценарий dumpBackup.php барлық вики парақтарын XML файлына тастайды. dumpBackup.php тек MediaWiki 1.5 немесе одан жаңа нұсқаларында жұмыс істейді. Бұл сценарийді іске қосу үшін сізге серверге тікелей кіру керек. Mediawiki жобаларының үйінділері (азды-көпті) үнемі қол жетімді http://download.wikipedia.org. Қосымша көмек мына жерде http://www.mediawiki.org/wiki/Manual:DumpBackup.php
  • Бар OAI-PMH- белгілі бір уақыттан бері өзгертілген беттерді үнемі алуға арналған интерфейс. Викимедиа жобалары үшін бұл интерфейс жалпыға қол жетімді емес. OAI-PMH нақты экспортталған мақалалардың айналасында орауыш пішімін қамтиды.
  • Пайдаланыңыз Python Wikipedia робот шеңбері. Мұнда түсіндірілмейді.

Әдепкіде парақтың тек ағымдағы нұсқасы қосылады. Таңдау бойынша сіз барлық нұсқаларды күні, уақыты, пайдаланушының аты және реферат редакциялауымен ала аласыз.

Сонымен қатар, сіз SQL мәліметтер базасын көшіре аласыз. Деректер базасының қоқыстары MediaWiki 1.5-ке дейін осылай қол жетімді болды және мұнда әрі қарай түсіндірілмейді.

'Special: Export' пайдалану

Экспорттау аттар кеңістігінің барлық беттері, Мысалға.

1. Экспортталатын беттердің аттарын алыңыз

  • Бару Арнайы: Allpage және қажетті аттар кеңістігін таңдаңыз.
  • Бет атауларының тізімін мәтіндік редакторға көшіріңіз
  • Барлық парақ атауларын бөлек жолдарға салыңыз
  • Егер таңдалған аттар кеңістігі негізгі аттар кеңістігі болмаса, бет кеңістігінің атын атаңыз (мысалы, 'Анықтама: Мазмұны').

2. Экспортты жүзеге асырыңыз

  • Бару Арнайы: Экспорт және бос жолдардың жоқтығына көз жеткізіп, барлық парақ атауларын мәтіндік жәшікке салыңыз.
  • «Сұранысты жіберу» түймесін басыңыз
  • Алынған XML файлын браузердің сақтау құралы арқылы сақтаңыз.

және соңында...

  • XML файлын мәтіндік редактордан ашыңыз. Төменге қарай айналдырыңыз қате туралы хабарламаларды тексеріңіз.

Енді сіз осы XML файлын келесіге қолдана аласыз импорттауды орындау.

Толық тарихты экспорттау

Ішіндегі құсбелгі Арнайы: Экспорт интерфейс толық тарихты (мақаланың барлық нұсқаларын) немесе мақалалардың ең соңғы нұсқасын экспорттауды таңдайды. Ең көбі 1000 түзету қайтарылды; басқа түзетулерді егжей-тегжейлі сұрауға болады MW: арнайы параметрлер: Экспорт.

Экспорт форматы

Сіз алатын XML файлының форматы барлық жағынан бірдей. Бұл формат кодификацияланған XML схемасы кезінде http://www.mediawiki.org/xml/export-0.6.xsd. Бұл формат веб-шолғышта қарауға арналмаған, дегенмен кейбір шолғыштар таңдалған бөліктерді қарау немесе жасыру үшін «+» және «-» сілтемелері бар әдемі басып шығарылған XML көрсетеді. Сонымен қатар, XML-дереккөзді шолушының «көру көзін» қолдану мүмкіндігі арқылы немесе XML файлын жергілікті сақтағаннан кейін таңдаған бағдарламасымен көруге болады. Егер сіз XML көзін тікелей оқысаңыз, нақты викитекстті табу қиын болмайды. Егер сіз арнайы XML редакторды пайдаланбасаңыз, «<» және «>» & lt; және & gt;, XML тегтерімен жанжалды болдырмау үшін; түсініксіздікті болдырмау үшін «&» «& amp;» деп кодталады.

Ағымдағы нұсқада экспорт форматында вики белгілеуінің XML ауыстыруы жоқ (қараңыз) Wikipedia DTD ескі ұсыныс үшін немесе Уики белгілеу тілі). Сіз викитексті мақаланы редакциялау кезінде ғана аласыз. (Экспорттан кейін сіз пайдалана аласыз балама талдаушылар викитексті басқа форматқа ауыстыру үшін)

Мысал

   xml: lang =«en»>    <page>      <title>Беттің тақырыбы</title>      <!-- page namespace code -->      <ns>0</ns>      <id>2</id>      <!-- If page is a redirection, element "redirect" contains title of the page redirect to -->      қайта бағыттау тақырып =«Бет атауын қайта бағыттау» />      <restrictions>edit = sysop: move = sysop</restrictions>      <revision>        <timestamp>2001-01-15T13: 15: 00Z</timestamp>        <contributor>          <username>Foobar</username>          <id>65536</id>        </contributor>        <comment>Менің бір айтарым бар!</comment>        <text>Мұнда [[мәтін]] топтама.</text>        <кіші />      </revision>      <revision>        <timestamp>2001-01-15T13: 10: 27Z</timestamp>        <contributor><ip>10.0.0.2</ip></contributor>        <comment>жаңа!</comment>        <text>Ертерек [[қайта қарау]].</text>      </revision>      <revision>        <!-- deleted revision example -->        <id>4557485</id>        <parentid>1243372</parentid>        <timestamp>2010-06-24T02: 40: 22Z</timestamp>        <үлес қосушы жойылды =«жойылды» />        <model>викитекст</model>        <format>мәтін / х-уики</format>        <мәтін жойылды =«жойылды» />        <sha1/>      </revision>    </page>        <page>      <title>Талқылау: беттің тақырыбы</title>      <revision>        <timestamp>2001-01-15T14: 03: 00Z</timestamp>        <contributor><ip>10.0.0.2</ip></contributor>        <comment>эй</comment>        <text>НЕГЕ БЕТТІ ҚҰЛПТАЙСЫЗ ?? !!! мен сол жынды жөндедім</text>      </revision>    </page>  </mediawiki>

DTD

Міне, ресми емес, қысқа Құжат түрін анықтау форматтың нұсқасы. Егер сіз DTD не екенін білмесеңіз, оны елемеңіз.

<!ELEMENT mediawiki (siteinfo?,page*)><!-- version contains the version number of the format (currently 0.3) -->  CDATA нұсқасы # ҚАЖЕТ   xmlns CDATA # БЕКІТІЛГЕН «http://www.mediawiki.org/xml/export-0.3/»  xmlns: xsi CDATA #FIXED «http://www.w3.org/2001/XMLSchema-instance»  xsi: schemaLocation CDATA #FIXED    «http://www.mediawiki.org/xml/export-0.3/ http://www.mediawiki.org/xml/export-0.3.xsd»><!ELEMENT siteinfo (sitename,base,generator,case,namespaces)><!ELEMENT sitename (#PCDATA)>      <!-- name of the wiki --><!ELEMENT base (#PCDATA)>          <!-- url of the main page --><!ELEMENT generator (#PCDATA)>     <!-- MediaWiki version string --><!ELEMENT case (#PCDATA)>          <!-- how cases in page names are handled -->                            'регистрге сезімтал емес' опциясы болашақ үшін сақталады -><!ELEMENT namespaces (namespace+)> <!-- list of namespaces and prefixes -->  <!ELEMENT namespace (#PCDATA)>     <!-- contains namespace prefix -->  <!ATTLIST namespace key CDATA #REQUIRED> <!-- internal namespace number --><!ELEMENT page (title,id?,restrictions?,(revision|upload)*)>  <!ELEMENT title (#PCDATA)>         <!-- Title with namespace prefix -->  <!ELEMENT id (#PCDATA)>   <!ELEMENT restrictions (#PCDATA)>  <!-- optional page restrictions --><!ELEMENT revision (id?,timestamp,contributor,minor?,comment,text)>  <!ELEMENT timestamp (#PCDATA)>     <!-- according to ISO8601 -->  <!ELEMENT minor EMPTY>             <!-- minor flag -->  <!ELEMENT comment (#PCDATA)>   <!ELEMENT text (#PCDATA)>          <!-- Wikisyntax -->  <!ATTLIST text xml:space CDATA  #FIXED "preserve"><!ELEMENT contributor ((username,id) | ip)>  <!ELEMENT username (#PCDATA)>  <!ELEMENT ip (#PCDATA)><!ELEMENT upload (timestamp,contributor,comment?,filename,src,size)>  <!ELEMENT filename (#PCDATA)>  <!ELEMENT src (#PCDATA)>  <!ELEMENT size (#PCDATA)>

XML экспортын өңдеу

Көптеген құралдар экспортталған XML-ді өңдей алады. Егер сіз парақтардың көп мөлшерін өңдейтін болсаңыз (мысалы, тұтас қоқыс), сіз құжатты негізгі жадқа ала алмай қалуыңыз мүмкін, сондықтан сізге талдау құралы қажет болады SAX немесе басқа оқиғаларға негізделген әдістер.

Сіз XML кодының бөліктерін тікелей өңдеу үшін тұрақты тіркестерді қолдана аласыз. Бұлар тез жүгіреді, бірақ оларды ұстау қиын.

XML экспортын өңдеу әдістері мен құралдарын мына жерде келтіріңіз:

Толығырақ және практикалық кеңестер

  • Беттің атау кеңістігін анықтау үшін оның тақырыбын префиксте анықталған префиксімен сәйкестендіру керек

/ mediawiki / siteinfo / аттар кеңістігі / аттар кеңістігі

  • Мүмкін шектеулер
    • sysop (қорғалған беттер)

Сондай-ақ қараңыз

Уикипедияға арналған анықтама