[Résolu] Ouvrir une page de très grande taille
Modérateurs : nico@nc, Mori, jpj, myahoo
[Résolu] Ouvrir une page de très grande taille
NB : le sujet original était "forcer 'enregistrer la cible du lien sous' " / Je le modifie au regard de la solution
Bonjour,
Voici le problème :
La bibliothèque nationale propose des livres anciens scannés qui peuvent aussi être téléchargés en texte (OCR).
Le bug est que la page de texte est beaucoup trop longue pour un navigateur. Firefox plante (quelle que soit la RAM) et Internet Explorer télécharge la page mais toute manipulation fait bugger :
http://gallica.bnf.fr/ark:/12148/bpt6k5 ... age.langFR
Si on clique en haut à droite du livre, on peut demander le livre en txt (en cochant une case pour les conditions d'utilisation).
La solution que j'imagine est la suivante :
enregistrer directement la page puis l'ouvrir avec Openoffice qui gère bien mieux les longs documents.
OUI MAIS : le lien "envoyer" qui envoie la requête pour obtenir le livre au format txt, n'a aucun menu contextuel.
Existe-t-il un moyen (extension ?)de forcer l'action "enregistrer la cible du lien sous" ? (Ou alors de trouver un URL adéquat ?)
NB : j'ai essayé d'utiliser un logiciel de téléchargement genre Free Download Manager ou FlashGot mais l'URL du livre au format txt n'est pas reconnu. J'ai aussi cherché des réponses un peu partout dans les forums.
Anvers
(Firefox 3.6.13 / Win XP)
Merci de votre aide, ça peut concerner beaucoup de gens !
Bonjour,
Voici le problème :
La bibliothèque nationale propose des livres anciens scannés qui peuvent aussi être téléchargés en texte (OCR).
Le bug est que la page de texte est beaucoup trop longue pour un navigateur. Firefox plante (quelle que soit la RAM) et Internet Explorer télécharge la page mais toute manipulation fait bugger :
http://gallica.bnf.fr/ark:/12148/bpt6k5 ... age.langFR
Si on clique en haut à droite du livre, on peut demander le livre en txt (en cochant une case pour les conditions d'utilisation).
La solution que j'imagine est la suivante :
enregistrer directement la page puis l'ouvrir avec Openoffice qui gère bien mieux les longs documents.
OUI MAIS : le lien "envoyer" qui envoie la requête pour obtenir le livre au format txt, n'a aucun menu contextuel.
Existe-t-il un moyen (extension ?)de forcer l'action "enregistrer la cible du lien sous" ? (Ou alors de trouver un URL adéquat ?)
NB : j'ai essayé d'utiliser un logiciel de téléchargement genre Free Download Manager ou FlashGot mais l'URL du livre au format txt n'est pas reconnu. J'ai aussi cherché des réponses un peu partout dans les forums.
Anvers
(Firefox 3.6.13 / Win XP)
Merci de votre aide, ça peut concerner beaucoup de gens !
Dernière modification par Anvers le 16 févr. 2011, 12:44, modifié 1 fois.
Re: Forcer "enregistrer la cible du lien"
Bonjour
Je ne vois pas où est le problème ! Essaye en mode sans échec de Firefox.(sans rien cocher) Peut-être une extension qui four la zone !
De toute façon, il doit être impossible d'utiliser un autre logiciel qu'un navigateur
Car il faut valider que c'est à utilisation non commercial.. Et donc pas de "enregistrer la cible du lien sous", ce qui est logique.
Il faut commencer par un clic gauche sur le lien de téléchargement puis une pop-up s'ouvre et après avoir remplie celle-ci ..tu arrive sur un nouvel onglet(ou pas selon ta config..). Et patienter un peu

Je ne vois pas où est le problème ! Essaye en mode sans échec de Firefox.(sans rien cocher) Peut-être une extension qui four la zone !
De toute façon, il doit être impossible d'utiliser un autre logiciel qu'un navigateur

Il faut commencer par un clic gauche sur le lien de téléchargement puis une pop-up s'ouvre et après avoir remplie celle-ci ..tu arrive sur un nouvel onglet(ou pas selon ta config..). Et patienter un peu


Sauvegardez le profil de votre Firefox , avant d'y faire des modifications(install, etc..) 
"Le bonheur est souvent la seule chose qu'on puisse donner sans l'avoir, et c'est en le donnant qu'on l'acquiert." Voltaire


"Le bonheur est souvent la seule chose qu'on puisse donner sans l'avoir, et c'est en le donnant qu'on l'acquiert." Voltaire

Re: Forcer "enregistrer la cible du lien"
Coucou Bob, c'est ce que fait apparemment Anvers et → ça plante tandis que chez d'autre ça freeeze !Bob49 a écrit :Il faut commencer par un clic gauche (..) Et patienter un peu![]()
☑ une vraie réponse a pour but premier d'aider ❒ non pour soigner son manque.
▬ ➤ ◐ ◑ ★ ☆ • ● ◉ ❍ ▼ ☑ ➔ ☐ ❑ ➜ ➸ ➻ « »
▬ ➤ ◐ ◑ ★ ☆ • ● ◉ ❍ ▼ ☑ ➔ ☐ ❑ ➜ ➸ ➻ « »
Re: Forcer "enregistrer la cible du lien"
Salut Demot
Je viens de faire l'essai pour l'avoir en texte..ça monte en mémoire Ram jusqu’au maximum autorisé pour ne pas planter le système..Firefox à été fermé à l'arrivé de 1700 Mo de Ram utilisé.
J'ai essayer l'import du pdf avec OOo mais j'étais déjà rendu à 1400Mo de Ram utilisé par celui-ci...donc je l'ai stoppé. (J'ai que 2 Go de Ram
)
Je pense que pour effectuer ses 2 essais, il faut 3 Go de Ram.. Sinon le plus simple étant d'utiliser en PDF.
OuiDemot a écrit :Coucou Bob, c'est ce que fait apparemment Anvers et → ça plante tandis que chez d'autre ça freeeze !Bob49 a écrit :Il faut commencer par un clic gauche (..) Et patienter un peu![]()

Je viens de faire l'essai pour l'avoir en texte..ça monte en mémoire Ram jusqu’au maximum autorisé pour ne pas planter le système..Firefox à été fermé à l'arrivé de 1700 Mo de Ram utilisé.
J'ai essayer l'import du pdf avec OOo mais j'étais déjà rendu à 1400Mo de Ram utilisé par celui-ci...donc je l'ai stoppé. (J'ai que 2 Go de Ram

Je pense que pour effectuer ses 2 essais, il faut 3 Go de Ram.. Sinon le plus simple étant d'utiliser en PDF.
A ma connaissance, non ! vu que ce bouton n'est pas programmé pour.Anvers a écrit :Existe-t-il un moyen (extension ?)de forcer l'action "enregistrer la cible du lien sous" ? (Ou alors de trouver un URL adéquat ?)
Sauvegardez le profil de votre Firefox , avant d'y faire des modifications(install, etc..) 
"Le bonheur est souvent la seule chose qu'on puisse donner sans l'avoir, et c'est en le donnant qu'on l'acquiert." Voltaire


"Le bonheur est souvent la seule chose qu'on puisse donner sans l'avoir, et c'est en le donnant qu'on l'acquiert." Voltaire

Re: Forcer "enregistrer la cible du lien"
Bonsoir,
[HS]
Le gros avantage de la version texte par OCR par rapport à la version image, c'est que les passage qui sont peu lisibles en version image sont totalement incompréhensibles en version texte.
Car si ceci est difficile à lire :

la transcription est légèrement ésotérique :(Bas de l'avant dernière page du premier lien donné ci-dessous.)
[/HS]
Bon, sinon, il semble qu'il y ait un gros problème avec le fichier donné par Anvers. Je n'ai pas trouvé de livre aussi important (953 p.) mais avec ceux-ci :
http://gallica.bnf.fr/ark:/12148/bpt6k9 ... .r=.langFR (625 p.)
http://gallica.bnf.fr/ark:/12148/bpt6k27852h.r=.langFR (570 p.)
il n'y a pas de problème.
Enfin, pas de problème pour le téléchargement et l'affichage parce que pour la lecture (ici, page 18/570 de ceci "Toutefois il existe entre les ~CC?'~ ~9 temps ~g/'0~9 et les T~C! de /Ma/~ a?< v'yi'6~/c, analogie de titre plutôt que de composition et de but." ).
(Mon logiciel d'OCR écran s'en est plutôt mieux sorti : "Toutefois il existe entre les Récits de.H temps mérovingiens et les ïiôtits de Vhistoire romaine an x**iidet analogie <le titre plutôt que de composition et de but.")
Il est quand même probable que le fichier du Dalloz de 1857 soir corrompu ou quelque chose de ce genre.
[HS]
Le gros avantage de la version texte par OCR par rapport à la version image, c'est que les passage qui sont peu lisibles en version image sont totalement incompréhensibles en version texte.
Car si ceci est difficile à lire :

la transcription est légèrement ésotérique :
Code : Tout sélectionner
UWM ))t. CïMHtCUE. TMt$t6ME P<RT)E.
M! ttOUVtiUMT DM M6T~"ES t)AT<MEM.
etMttTKE t". Wooemxftt <<'xt) ~Mme maMt'M ')t«<M<t~Mf' tM
Theertmctted'Attmbert. iM
Premier (tx'or~tx 9~ra<, ou théorème do nteMwment du centre
deeratM.iM
~eM~me ~t<'er<f))< a~xfat, ou théorème des quanuMia de mouye-
mentprojet~MtiurunMe.00
yrotW)M< tA~r~e 9<M)'o<, ou théorème des moments des quanUtee
demeuvemmtpWMpperttunMe. «S!
'fhëe~medeiiatrM.9
OMotnMtM ~«'ortfHt général, ou tinjertme des forces vives. <M
Remarques sur les théorèmes généraux qui précèdent tM
Extension des théorèmes généraux sur le mouvement dea systèmes
nMtërteb, M CM des mouvements rctatib. <N)
Mouvement d'mtyetenxmatertet par rapport à détaxer de direction
MMtantepMMntparMnecntredesmvttp. MO
[/HS]
Bon, sinon, il semble qu'il y ait un gros problème avec le fichier donné par Anvers. Je n'ai pas trouvé de livre aussi important (953 p.) mais avec ceux-ci :
http://gallica.bnf.fr/ark:/12148/bpt6k9 ... .r=.langFR (625 p.)
http://gallica.bnf.fr/ark:/12148/bpt6k27852h.r=.langFR (570 p.)
il n'y a pas de problème.
Enfin, pas de problème pour le téléchargement et l'affichage parce que pour la lecture (ici, page 18/570 de ceci "Toutefois il existe entre les ~CC?'~ ~9 temps ~g/'0~9 et les T~C! de /Ma/~ a?< v'yi'6~/c, analogie de titre plutôt que de composition et de but." ).

Il est quand même probable que le fichier du Dalloz de 1857 soir corrompu ou quelque chose de ce genre.
► Si votre problème est [Résolu], svp, marquez-le.
► Pas de support par mp, l’aide se fait sur le forum.
► Pas de support par mp, l’aide se fait sur le forum.
Re: Forcer "enregistrer la cible du lien"
Merci de vos réponses.
Effectivement, un bon OCR pourrait résoudre le problème, parce que le pdf, on peut le télécharger directement en ftp.
jpj, peux-tu m'indiquer STP quel OCR écran tu utilises ?
Effectivement, un bon OCR pourrait résoudre le problème, parce que le pdf, on peut le télécharger directement en ftp.
jpj, peux-tu m'indiquer STP quel OCR écran tu utilises ?
Re: Forcer "enregistrer la cible du lien"
Bonjour,
V330 Photo ; curieusement, il n'est pas livré avec un modèle supérieur de la même marque). Le scanner est livré également avec une version limitée OEM de ABBYY FineReader.
Comme j'utilise peu l'OCR, je me contente des logiciels OEM livrés avec le matériel et je ne sais pas quels sont les meilleurs. D'après un test de gnt ici, ce sont ABBYY FineReader 10 Professional Edition et Omnipage 17 Professional qui sont les mieux classés mais que vaut le test ?
Dans le cas de Gallica / BNF, il faut voir aussi qu'ils semblent utiliser les livres déjà numérisés et que les fichiers d'origine ne sont probablement pas terribles. Ils ont été faits pour être lisible, parfois tout juste, à l'écran mais sont souvent en définition trop limitée pour l'OCR (surtout quand il s'agit de notes en petits caractères). De plus, les typographies du XIXe siècle ne facilitent pas le travail des logiciels (c'est évidemment encore pire avec les éditions du XVIIe ou XVIIIe siècle).
Le test que j'ai mis dans mon message a été fait avec ABBYY Screenshot Reader en version OEM livré avec mon scanner Epson (PerfectionAnvers a écrit :jpj, peux-tu m'indiquer STP quel OCR écran tu utilises ?
V330 Photo ; curieusement, il n'est pas livré avec un modèle supérieur de la même marque). Le scanner est livré également avec une version limitée OEM de ABBYY FineReader.
Comme j'utilise peu l'OCR, je me contente des logiciels OEM livrés avec le matériel et je ne sais pas quels sont les meilleurs. D'après un test de gnt ici, ce sont ABBYY FineReader 10 Professional Edition et Omnipage 17 Professional qui sont les mieux classés mais que vaut le test ?
Dans le cas de Gallica / BNF, il faut voir aussi qu'ils semblent utiliser les livres déjà numérisés et que les fichiers d'origine ne sont probablement pas terribles. Ils ont été faits pour être lisible, parfois tout juste, à l'écran mais sont souvent en définition trop limitée pour l'OCR (surtout quand il s'agit de notes en petits caractères). De plus, les typographies du XIXe siècle ne facilitent pas le travail des logiciels (c'est évidemment encore pire avec les éditions du XVIIe ou XVIIIe siècle).
► Si votre problème est [Résolu], svp, marquez-le.
► Pas de support par mp, l’aide se fait sur le forum.
► Pas de support par mp, l’aide se fait sur le forum.
Re: Forcer "enregistrer la cible du lien"
Bonne nouvelle : en mode sans échec, ça marche, la RAM reste dans des limites raisonnables et j'ai réussi à sauvegarder le fichier et l'ouvrir avec Openoffice.
Merci pour tout.
Merci pour tout.
Qui est en ligne ?
Utilisateurs parcourant ce forum : Aucun utilisateur inscrit et 7 invités