GerginGörünüşlüAdam
Kilopat
[CODE lang="python" title="Python"]# -*- coding: utf-8 -*-
from urllib import parse
import scrapy
from scrapy.linkextractors import LinkExtractor
import codecs
class WanikaniSpider(scrapy.Spider):
name = 'japandict'
allowed_domains = ['www.wanikani.com']
url = ('https://www.wanikani.com/kanji/')
start_urls = []
kanjiler = ["悪", "安", "以", "意", "医"]
liste=[]
for kanji in kanjiler:
liste.append(kanji)
nurl = url + kanji
start_urls.append(nurl)
def parse(self, response):
print(response.url)
kanjiicon = response.xpath('//*[@id="main"]/body/div[1]/div[3]/div/div/header/h1/span/text()').getall()
meanings = response.xpath('//*[@id="main"]/body/div[1]/div[3]/div/div/header/h1/text()').getall()
reading = response.xpath('//*[@id="reading"]/div')
for onkun in reading:
onyomi= onkun.xpath('//*[@id="reading"]/div/div[1]/p/text()').getall()
kunyomi= onkun.xpath('//*[@id="reading"]/div/div[2]/p/text()').getall()
for x in onyomi:
print(x)
[/CODE]
Bu şekilde bir Scrapy Spider'ı oluşturdum. En son kısımda print(x) yaptığımda sorunsuz bir şekilde çıktı alıyorum. Fakat bunun çıktısını dosya olarak almak için return veya yield ile dönmek gerekiyor. Bu generatorlar ile döndüğümde ise satır boşlukları oluyor virgüller birbirine giriyor vs.
Bunu nasıl düzeltebilirim?
from urllib import parse
import scrapy
from scrapy.linkextractors import LinkExtractor
import codecs
class WanikaniSpider(scrapy.Spider):
name = 'japandict'
allowed_domains = ['www.wanikani.com']
url = ('https://www.wanikani.com/kanji/')
start_urls = []
kanjiler = ["悪", "安", "以", "意", "医"]
liste=[]
for kanji in kanjiler:
liste.append(kanji)
nurl = url + kanji
start_urls.append(nurl)
def parse(self, response):
print(response.url)
kanjiicon = response.xpath('//*[@id="main"]/body/div[1]/div[3]/div/div/header/h1/span/text()').getall()
meanings = response.xpath('//*[@id="main"]/body/div[1]/div[3]/div/div/header/h1/text()').getall()
reading = response.xpath('//*[@id="reading"]/div')
for onkun in reading:
onyomi= onkun.xpath('//*[@id="reading"]/div/div[1]/p/text()').getall()
kunyomi= onkun.xpath('//*[@id="reading"]/div/div[2]/p/text()').getall()
for x in onyomi:
print(x)
[/CODE]
Bu şekilde bir Scrapy Spider'ı oluşturdum. En son kısımda print(x) yaptığımda sorunsuz bir şekilde çıktı alıyorum. Fakat bunun çıktısını dosya olarak almak için return veya yield ile dönmek gerekiyor. Bu generatorlar ile döndüğümde ise satır boşlukları oluyor virgüller birbirine giriyor vs.
Bunu nasıl düzeltebilirim?
Son düzenleyen: Moderatör: