WikiDer > Көмек: Экспорт - Википедия
Бұл анықтама беті қалай басшылыққа алу керек. Онда Уикипедия нормалары мен тәжірибелерінің кейбір аспектілері (-лері) бойынша процедуралар немесе процедуралар егжей-тегжейлі баяндалған. Бұл біреу емес Википедия ережелері немесе нұсқаулары, және әр түрлі деңгейлерді көрсетуі мүмкін консенсус және тексеру. |
Уики-парақтарды арнайы түрде экспорттауға болады XML форматты импорт мысалы, басқа MediaWiki қондырғысына қосыңыз немесе оны басқаша пайдаланыңыз, мысалы, мазмұнды талдау үшін. Сондай-ақ қараңыз m: синдикат арналары беттерден басқа барлық басқа ақпаратты экспорттауға арналған және қараңыз Анықтама: импорттау беттерді импорттау кезінде.
Қалай экспорттауға болады
Беттерді экспорттаудың кем дегенде алты әдісі бар:
- Мақалалардың атауын жолға салыңыз Арнайы: Экспорт немесе пайдалану https://kk.wikipedia.org/wiki/Special:Export/FULLPAGENAME.
- Пайдаланыңыз
әрекет = шикі. (Бұл парақтың тек викитекстін алады, ал төменде сипатталған XML пішімін емес.) Мысалы: https://kk.wikipedia.org/w/index.php?title=Wikipedia&action=raw .. пайдалану өте маңызды/w/index.php?title=PAGENAME&action=rawжәне емес/ wiki / PAGENAME? action = raw(қараңыз Phab T126183) - XML немесе JSON қаптамасындағы деректерді алу үшін API қолданыңыз
- Қосымша сценарий dumpBackup.php барлық вики парақтарын XML файлына тастайды. dumpBackup.php тек MediaWiki 1.5 немесе одан жаңа нұсқаларында жұмыс істейді. Бұл сценарийді іске қосу үшін сізге серверге тікелей кіру керек. Mediawiki жобаларының үйінділері (азды-көпті) үнемі қол жетімді http://download.wikipedia.org. Қосымша көмек мына жерде http://www.mediawiki.org/wiki/Manual:DumpBackup.php
- Бар OAI-PMH- белгілі бір уақыттан бері өзгертілген беттерді үнемі алуға арналған интерфейс. Викимедиа жобалары үшін бұл интерфейс жалпыға қол жетімді емес. OAI-PMH нақты экспортталған мақалалардың айналасында орауыш пішімін қамтиды.
- Пайдаланыңыз Python Wikipedia робот шеңбері. Мұнда түсіндірілмейді.
Әдепкіде парақтың тек ағымдағы нұсқасы қосылады. Таңдау бойынша сіз барлық нұсқаларды күні, уақыты, пайдаланушының аты және реферат редакциялауымен ала аласыз.
Сонымен қатар, сіз SQL мәліметтер базасын көшіре аласыз. Деректер базасының қоқыстары MediaWiki 1.5-ке дейін осылай қол жетімді болды және мұнда әрі қарай түсіндірілмейді.
'Special: Export' пайдалану
Экспорттау аттар кеңістігінің барлық беттері, Мысалға.
1. Экспортталатын беттердің аттарын алыңыз
- Бару Арнайы: Allpage және қажетті аттар кеңістігін таңдаңыз.
- Бет атауларының тізімін мәтіндік редакторға көшіріңіз
- Барлық парақ атауларын бөлек жолдарға салыңыз
- Егер таңдалған аттар кеңістігі негізгі аттар кеңістігі болмаса, бет кеңістігінің атын атаңыз (мысалы, 'Анықтама: Мазмұны').
2. Экспортты жүзеге асырыңыз
- Бару Арнайы: Экспорт және бос жолдардың жоқтығына көз жеткізіп, барлық парақ атауларын мәтіндік жәшікке салыңыз.
- «Сұранысты жіберу» түймесін басыңыз
- Алынған XML файлын браузердің сақтау құралы арқылы сақтаңыз.
және соңында...
- XML файлын мәтіндік редактордан ашыңыз. Төменге қарай айналдырыңыз қате туралы хабарламаларды тексеріңіз.
Енді сіз осы XML файлын келесіге қолдана аласыз импорттауды орындау.
Толық тарихты экспорттау
Ішіндегі құсбелгі Арнайы: Экспорт интерфейс толық тарихты (мақаланың барлық нұсқаларын) немесе мақалалардың ең соңғы нұсқасын экспорттауды таңдайды. Ең көбі 1000 түзету қайтарылды; басқа түзетулерді егжей-тегжейлі сұрауға болады MW: арнайы параметрлер: Экспорт.
Экспорт форматы
Сіз алатын XML файлының форматы барлық жағынан бірдей. Бұл формат кодификацияланған XML схемасы кезінде http://www.mediawiki.org/xml/export-0.6.xsd. Бұл формат веб-шолғышта қарауға арналмаған, дегенмен кейбір шолғыштар таңдалған бөліктерді қарау немесе жасыру үшін «+» және «-» сілтемелері бар әдемі басып шығарылған XML көрсетеді. Сонымен қатар, XML-дереккөзді шолушының «көру көзін» қолдану мүмкіндігі арқылы немесе XML файлын жергілікті сақтағаннан кейін таңдаған бағдарламасымен көруге болады. Егер сіз XML көзін тікелей оқысаңыз, нақты викитекстті табу қиын болмайды. Егер сіз арнайы XML редакторды пайдаланбасаңыз, «<» және «>» & lt; және & gt;, XML тегтерімен жанжалды болдырмау үшін; түсініксіздікті болдырмау үшін «&» «& amp;» деп кодталады.
Ағымдағы нұсқада экспорт форматында вики белгілеуінің XML ауыстыруы жоқ (қараңыз) Wikipedia DTD ескі ұсыныс үшін немесе Уики белгілеу тілі). Сіз викитексті мақаланы редакциялау кезінде ғана аласыз. (Экспорттан кейін сіз пайдалана аласыз балама талдаушылар викитексті басқа форматқа ауыстыру үшін)
Мысал
xml: lang =«en»> <page> <title>Беттің тақырыбы</title> <!-- page namespace code --> <ns>0</ns> <id>2</id> <!-- If page is a redirection, element "redirect" contains title of the page redirect to --> қайта бағыттау тақырып =«Бет атауын қайта бағыттау» /> <restrictions>edit = sysop: move = sysop</restrictions> <revision> <timestamp>2001-01-15T13: 15: 00Z</timestamp> <contributor> <username>Foobar</username> <id>65536</id> </contributor> <comment>Менің бір айтарым бар!</comment> <text>Мұнда [[мәтін]] топтама.</text> <кіші /> </revision> <revision> <timestamp>2001-01-15T13: 10: 27Z</timestamp> <contributor><ip>10.0.0.2</ip></contributor> <comment>жаңа!</comment> <text>Ертерек [[қайта қарау]].</text> </revision> <revision> <!-- deleted revision example --> <id>4557485</id> <parentid>1243372</parentid> <timestamp>2010-06-24T02: 40: 22Z</timestamp> <үлес қосушы жойылды =«жойылды» /> <model>викитекст</model> <format>мәтін / х-уики</format> <мәтін жойылды =«жойылды» /> <sha1/> </revision> </page> <page> <title>Талқылау: беттің тақырыбы</title> <revision> <timestamp>2001-01-15T14: 03: 00Z</timestamp> <contributor><ip>10.0.0.2</ip></contributor> <comment>эй</comment> <text>НЕГЕ БЕТТІ ҚҰЛПТАЙСЫЗ ?? !!! мен сол жынды жөндедім</text> </revision> </page> </mediawiki> DTD
Міне, ресми емес, қысқа Құжат түрін анықтау форматтың нұсқасы. Егер сіз DTD не екенін білмесеңіз, оны елемеңіз.
<!ELEMENT mediawiki (siteinfo?,page*)><!-- version contains the version number of the format (currently 0.3) --> CDATA нұсқасы # ҚАЖЕТ xmlns CDATA # БЕКІТІЛГЕН «http://www.mediawiki.org/xml/export-0.3/» xmlns: xsi CDATA #FIXED «http://www.w3.org/2001/XMLSchema-instance» xsi: schemaLocation CDATA #FIXED «http://www.mediawiki.org/xml/export-0.3/ http://www.mediawiki.org/xml/export-0.3.xsd»><!ELEMENT siteinfo (sitename,base,generator,case,namespaces)><!ELEMENT sitename (#PCDATA)> <!-- name of the wiki --><!ELEMENT base (#PCDATA)> <!-- url of the main page --><!ELEMENT generator (#PCDATA)> <!-- MediaWiki version string --><!ELEMENT case (#PCDATA)> <!-- how cases in page names are handled --> 'регистрге сезімтал емес' опциясы болашақ үшін сақталады -><!ELEMENT namespaces (namespace+)> <!-- list of namespaces and prefixes --> <!ELEMENT namespace (#PCDATA)> <!-- contains namespace prefix --> <!ATTLIST namespace key CDATA #REQUIRED> <!-- internal namespace number --><!ELEMENT page (title,id?,restrictions?,(revision|upload)*)> <!ELEMENT title (#PCDATA)> <!-- Title with namespace prefix --> <!ELEMENT id (#PCDATA)> <!ELEMENT restrictions (#PCDATA)> <!-- optional page restrictions --><!ELEMENT revision (id?,timestamp,contributor,minor?,comment,text)> <!ELEMENT timestamp (#PCDATA)> <!-- according to ISO8601 --> <!ELEMENT minor EMPTY> <!-- minor flag --> <!ELEMENT comment (#PCDATA)> <!ELEMENT text (#PCDATA)> <!-- Wikisyntax --> <!ATTLIST text xml:space CDATA #FIXED "preserve"><!ELEMENT contributor ((username,id) | ip)> <!ELEMENT username (#PCDATA)> <!ELEMENT ip (#PCDATA)><!ELEMENT upload (timestamp,contributor,comment?,filename,src,size)> <!ELEMENT filename (#PCDATA)> <!ELEMENT src (#PCDATA)> <!ELEMENT size (#PCDATA)>XML экспортын өңдеу
Көптеген құралдар экспортталған XML-ді өңдей алады. Егер сіз парақтардың көп мөлшерін өңдейтін болсаңыз (мысалы, тұтас қоқыс), сіз құжатты негізгі жадқа ала алмай қалуыңыз мүмкін, сондықтан сізге талдау құралы қажет болады SAX немесе басқа оқиғаларға негізделген әдістер.
Сіз XML кодының бөліктерін тікелей өңдеу үшін тұрақты тіркестерді қолдана аласыз. Бұлар тез жүгіреді, бірақ оларды ұстау қиын.
XML экспортын өңдеу әдістері мен құралдарын мына жерде келтіріңіз:
- Бөлшек :: MediaWikiDump бұл XML демп-файлын өңдеуге арналған perl модулі.
- m: MediaWiki XML-ді STX көмегімен өңдеу - ағынға негізделген XML түрлендіру
Толығырақ және практикалық кеңестер
- Беттің атау кеңістігін анықтау үшін оның тақырыбын префиксте анықталған префиксімен сәйкестендіру керек
/ mediawiki / siteinfo / аттар кеңістігі / аттар кеңістігі
- Мүмкін шектеулер
- sysop (қорғалған беттер)
Сондай-ақ қараңыз
- mw: Анықтама: викиді басқа серверге қалай жылжыту керек
- mw: Қолмен: Moving_a_wiki
- Уикипедия: Википедия кітаптарын жасаушының мәртебесі
- Анықтама: ұялы байланыс
- Анықтама: медианы қарау
- Уикипедия: Ауызша мақалалар
- Википедия: Жиі қойылатын сұрақтар / Оқырмандар
- Википедия: Википедия туралы оқырманға арналған нұсқаулық
- Википедия: Википедиямен зерттеу
- Уикипедия: Уикипедияға сілтеме жасау
Уикипедияға арналған анықтама
- Уикипедия: WikiProject Трансвики / экспорттау - Уикипедия мақаласының бүкіл тарихын экспорттау туралы нұсқаулық.