KrISS feed 8.9 - Un simple et superbe (ou stupide) lecteur de flux. Par Tontof
  • Friday 19 April 2024 - 08:00
    Le géant technologique chinois, Huawei, a entamé la vente de deux modèles très attendus de sa série de smartphones haut de gamme Pura 70, même alors que de nombreux analystes prédisent qu’ils pourraient contenir une puce de fabrication chinoise avancée, à l’instar du Mate 60 de l’année dernière. La série Pura, développée par Huawei et [...]
  • Friday 19 April 2024 - 09:00
    Altice (SFR) ne lâche pas son emprise sur RMC Sport, gardant fermement ce précieux bijou télévisuel dans son escarcelle. Alors que le groupe décide de se séparer de ses chaînes RMC et BFM au profit de CMA CGM, une omission est soigneusement orchestrée : RMC Sport. Cette pépite stratégique demeure dans les griffes de l’opérateur [...]
  • Friday 19 April 2024 - 09:00

    Vous êtes-vous déjà demandé ce qui se cache dans les profondeurs obscures des dépôts Git publics ? Eh bien, figurez-vous qu’il y a un outil en ligne qui permet de dénicher des trucs de dingue ! Ça s’appelle Grep.app et c’est un moteur de recherche qui va vous faire halluciner.

    Concrètement, vous balancez votre recherche dans la barre et hop, ça vous sort tous les résultats où votre mot-clé apparaît dans les repos Git publics. Genre, vous tapez une adresse email et vous tombez sur tous les endroits où elle est mentionnée. Mais attention, hein… Y a pas que des trucs anodins qui traînent dans ces dépôts. Si vous cherchez un peu, vous pouvez même tomber sur des clés d’API AWS ou Google !

    Bon, après faut pas déconner non plus. Si vous tombez sur des clés dans un dépôt public, considérez-les comme grillées direct. Même si le dépôt est supprimé par la suite, y a plein de petits malins qui font ce genre de recherches régulièrement. Donc méfiance !

    Cela dit, Github a quand même mis en place un système d’alerte pour les clés, mots de passe, etc qui se retrouvent dans le code. Du coup, y a des chances que la plupart soient invalidées assez vite, soit par le développeur qui change sa clé, soit direct par le fournisseur. Mais on n’est jamais trop prudent…

    En parlant de Github, ils ont aussi leur propre outil de recherche de code qui est plutôt balèze. Ça s’appelle Github Code Search. Ça indexe environ 45 millions de dépôts, ce qui est déjà pas mal !

    En gros, ils utilisent un moteur de recherche maison qui indexe le contenu avec une technique appelée « sparse ngrams ». D’après eux, ça permet d’exécuter les recherches plus rapidement, tout en étant un index plus petit. Si vous voulez en savoir plus sur la technologie derrière, ils ont publié un article de blog super intéressant.

    Maintenant, est-ce que Grep.app est à la hauteur face à Github Code Search ? Difficile à dire… Une chose est sûre, c’est que Grep.app a l’air de se concentrer uniquement sur le code en lui-même. Donc si vous cherchez des chaînes de texte dans de la prose qui se retrouve dans des recherches de code, vous risquez de passer à côté avec Grep.app. Genre pour chercher dans des fichiers texte ou Markdown.

    Et ça, c’est un peu dommage. Parce que des fois, on a besoin de chercher du code avec plein de caractères spéciaux vicieux. Et là, la recherche de code actuelle de Github nous laisse tomber. Mais bon, on peut pas tout avoir non plus… En attendant, Grep.app reste quand même un outil bien pratique pour dénicher des infos cachées dans les entrailles de Git. Et puis c’est gratuit et open-source en plus !

  • Friday 19 April 2024 - 10:00
    Cette collaboration vise à offrir une expérience plus premium et personnalisée aux téléspectateurs, avec TF1+ préinstallé sur les nouvelles gammes 2024 et pré-téléchargé sur les modèles depuis 2018. Ainsi, les utilisateurs peuvent accéder à un vaste catalogue de contenus, y compris des émissions populaires telles que Star Academy, Koh-Lanta, The Voice et Danse avec les [...]
  • Friday 19 April 2024 - 10:02
    La merdification de Roku est en cours : Ils ont déposé un brevet pour détecter si la lecture est en pause sur votre écran HDMI, et afficher alors de la publicité par dessus l'image.
    (Permalink)
  • Friday 19 April 2024 - 10:05
    Les effets pervers des subventions et incitations... et quelques solutions.
    (Permalink)
  • Friday 19 April 2024 - 10:18

    PyTorch, le framework chouchou des bidouilleurs d’IA, vient de nous pondre un petit truc cool : Torchtune ! 💎 Cette nouvelle bibliothèque native, encore en phase alpha mais déjà disponible en open-source sur GitHub, va vous permettre de fine-tuner les gros modèles de langage (LLM) comme un pro, sans vous prendre la tête.

    Torchtune est donc une boîte à outils hyper flexible et modulaire qui va vous permettre de vous éclater à customiser des modèles pour vos propres besoins, le tout avec des recettes mémoire efficaces qui tournent même sur une bête carte graphique de gamer, comme les NVidia 3090/4090.

    Son secret ?

    Une architecture bien pensée qui mise sur l’interopérabilité avec l’écosystème des LLM, qu’ils soient open-source ou non. Concrètement, ça veut dire que vous allez pouvoir brancher Torchtune à tout un tas d’outils et de frameworks que vous adorez déjà, comme Hugging Face 🤗, PyTorch FSDP 🪢, Weights & Biases 📈, et plein d’autres.

    Grâce à des recettes simples et bien documentées pour les modèles populaires comme Llama 3, Mistral ou Gemma 7B, même les débutants vont pouvoir se lancer dans l’aventure sans flipper. Bon OK, il faudra quand même un peu de bagage en PyTorch et en LLM, mais rien d’insurmontable ! Et si vous êtes un pro, vous allez pouvoir hacker le code à volonté pour l’adapter à vos besoins spécifiques.

    Alors comment on met les mains dans le cambouis avec Torchtune ?

    Rien de plus simple, mon cher Watson ! Il vous suffit d’installer la dernière version stable de PyTorch (2.2.2 au moment où j’écris ces lignes), puis de télécharger Torchtune depuis PyPI avec un petit

    pip install torchtune

    Et voilà, vous êtes prêt à en découdre avec les LLM !

    Pour vous faire les dents, je vous conseille de jeter un œil au tutoriel sur le fine-tuning de Llama2 7B. C’est le parfait point de départ pour comprendre comment Torchtune fonctionne et comment l’utiliser pour vos propres projets.

    En gros, ça se passe en 4 étapes :

    1. Téléchargez le modèle pré-entraîné et le tokenizer depuis Hugging Face Hub avec tune download.
    2. Choisissez une recette de fine-tuning (LoRA, QLoRA, full…) et customisez-la avec un fichier de config en YAML.
    3. Lancez l’entraînement avec tune run en précisant votre recette et votre config. Vous pouvez même faire du multi-GPU avec torchrun !
    4. Admirez le résultat et testez votre modèle fine-tuné avec une inférence locale. Si tout se passe bien, exportez-le avec ExecuTorch pour le déployer en prod, ou utilisez les API de quantification de Torchao pour l’exporter en int4 ou int8 et l’utiliser sur mobile ou en edge.

    Facile, non ? 😄

    Bon OK, j’avoue, j’ai un peu simplifié. En vrai, il y a pas mal de subtilités et de paramètres à régler pour obtenir les meilleurs résultats, comme le learning rate, le nombre d’époques, la taille du batch, le ratio de LoRA, et tout un tas d’autres trucs, mais c’est justement sa flexibilité qui vous permet d’expérimenter à l’infini pour trouver la combinaison parfaite.

    Bref, si vous êtes dev et que vous aimez jouer avec les LLM c’est à tester.

    Source

  • Friday 19 April 2024 - 10:51
    Lavender, c'est l'I.A. que le gouvernement Israélien utilise pour décider qui tuer.
    WhatsApp est donc "chiffré de bout en bout" et "protège votre vie privée", mais l'Israël tue des personnes selon leur appartenance à certain groupes WhatsApps. Et attendent que vous soyez bien chez vous avec toute votre famille avant de bombarder la maison.
    Est-ce que Facebook a fourni des informations au gouvernement Israélien ?  Est-ce que WhatsApps est aussi sûr que le prétend Facebook ?

    (Au bout d'un moment il va falloir que les gens comprennent que les GAFAM aiment le capitalisme, et que le capitalisme n'est pas incompatible avec les gouvernements génocidaires (Israël, Chine, Russie...)). Il suffit de voir les courbettes que font les GAFAM en Chine pour continuer leur business.)

    EDIT: humpf... tiens puisque je vous le disais : https://next.ink/brief_article/projet-nimbus-google-licencie-28-salaries-qui-ont-manifeste-contre-un-contrat-cloud-avec-israel/
    (Permalink)
  • Friday 19 April 2024 - 11:00
    Selon des sources proches de Meta, l’entreprise aurait récemment entamé des discussions avec plusieurs marques pour introduire des formats publicitaires spécialement conçus pour Threads, son application de messagerie. Ces discussions, bien que centrées principalement sur la planification du lancement, ont suscité des interrogations sur les formats, les caractéristiques et les performances prévues des publicités, selon [...]