Whamcloud - gitweb
0c8884aab38c994b1b6266e0939d3afe2668be20
[fs/lustre-release.git] / lustre / mdd / mdd_lov.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2012, Whamcloud, Inc.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mdd/mdd_lov.c
37  *
38  * Lustre Metadata Server (mds) handling of striped file data
39  *
40  * Author: Peter Braam <braam@clusterfs.com>
41  * Author: wangdi <wangdi@clusterfs.com>
42  */
43
44 #ifndef EXPORT_SYMTAB
45 # define EXPORT_SYMTAB
46 #endif
47 #define DEBUG_SUBSYSTEM S_MDS
48
49 #include <linux/module.h>
50 #include <obd.h>
51 #include <obd_class.h>
52 #include <lustre_ver.h>
53 #include <obd_support.h>
54 #include <obd_lov.h>
55 #include <lprocfs_status.h>
56 #include <lustre_mds.h>
57 #include <lustre_fid.h>
58 #include <lustre/lustre_idl.h>
59
60 #include "mdd_internal.h"
61
62 static int mdd_notify(struct obd_device *host, struct obd_device *watched,
63                       enum obd_notify_event ev, void *owner, void *data)
64 {
65         struct mdd_device *mdd = owner;
66         int rc = 0;
67         ENTRY;
68
69         LASSERT(owner != NULL);
70         switch (ev)
71         {
72                 case OBD_NOTIFY_ACTIVE:
73                 case OBD_NOTIFY_SYNC:
74                 case OBD_NOTIFY_SYNC_NONBLOCK:
75                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev,
76                                           MD_LOV_SYNC, data);
77                         break;
78                 case OBD_NOTIFY_CONFIG:
79                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev,
80                                           MD_LOV_CONFIG, data);
81                         break;
82 #ifdef HAVE_QUOTA_SUPPORT
83                 case OBD_NOTIFY_QUOTA:
84                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev,
85                                           MD_LOV_QUOTA, data);
86                         break;
87 #endif
88                 default:
89                         CDEBUG(D_INFO, "Unhandled notification %#x\n", ev);
90         }
91
92         RETURN(rc);
93 }
94
95 /* The obd is created for handling data stack for mdd */
96 int mdd_init_obd(const struct lu_env *env, struct mdd_device *mdd,
97                  struct lustre_cfg *cfg)
98 {
99         char                   *dev = lustre_cfg_string(cfg, 0);
100         int                     rc, name_size, uuid_size;
101         char                   *name, *uuid;
102         __u32                   mds_id;
103         struct lustre_cfg_bufs *bufs;
104         struct lustre_cfg      *lcfg;
105         struct obd_device      *obd;
106         ENTRY;
107
108         mds_id = lu_site2md(mdd2lu_dev(mdd)->ld_site)->ms_node_id;
109         name_size = strlen(MDD_OBD_NAME) + 35;
110         uuid_size = strlen(MDD_OBD_UUID) + 35;
111
112         OBD_ALLOC(name, name_size);
113         OBD_ALLOC(uuid, uuid_size);
114         if (name == NULL || uuid == NULL)
115                 GOTO(cleanup_mem, rc = -ENOMEM);
116
117         OBD_ALLOC_PTR(bufs);
118         if (!bufs)
119                 GOTO(cleanup_mem, rc = -ENOMEM);
120
121         snprintf(name, strlen(MDD_OBD_NAME) + 35, "%s-%s",
122                  MDD_OBD_NAME, dev);
123
124         snprintf(uuid, strlen(MDD_OBD_UUID) + 35, "%s-%s",
125                  MDD_OBD_UUID, dev);
126
127         lustre_cfg_bufs_reset(bufs, name);
128         lustre_cfg_bufs_set_string(bufs, 1, MDD_OBD_TYPE);
129         lustre_cfg_bufs_set_string(bufs, 2, uuid);
130         lustre_cfg_bufs_set_string(bufs, 3, (char*)dev/* MDD_OBD_PROFILE */);
131         lustre_cfg_bufs_set_string(bufs, 4, (char*)dev);
132
133         lcfg = lustre_cfg_new(LCFG_ATTACH, bufs);
134         OBD_FREE_PTR(bufs);
135         if (!lcfg)
136                 GOTO(cleanup_mem, rc = -ENOMEM);
137
138         rc = class_attach(lcfg);
139         if (rc)
140                 GOTO(lcfg_cleanup, rc);
141
142         obd = class_name2obd(name);
143         if (!obd) {
144                 CERROR("Can not find obd %s\n", MDD_OBD_NAME);
145                 LBUG();
146         }
147
148         cfs_spin_lock(&obd->obd_dev_lock);
149         obd->obd_recovering = 1;
150         cfs_spin_unlock(&obd->obd_dev_lock);
151         obd->u.mds.mds_id = mds_id;
152         obd->u.obt.obt_osd_properties.osd_max_ea_size =
153                                                mdd->mdd_dt_conf.ddp_max_ea_size;
154
155         rc = class_setup(obd, lcfg);
156         if (rc)
157                 GOTO(class_detach, rc);
158
159         /*
160          * Add here for obd notify mechanism, when adding a new ost, the mds
161          * will notify this mdd. The mds will be used for quota also.
162          */
163         obd->obd_upcall.onu_upcall = mdd_notify;
164         obd->obd_upcall.onu_owner = mdd;
165         mdd->mdd_obd_dev = obd;
166
167         EXIT;
168 class_detach:
169         if (rc)
170                 class_detach(obd, lcfg);
171 lcfg_cleanup:
172         lustre_cfg_free(lcfg);
173 cleanup_mem:
174         if (name)
175                 OBD_FREE(name, name_size);
176         if (uuid)
177                 OBD_FREE(uuid, uuid_size);
178         return rc;
179 }
180
181 int mdd_fini_obd(const struct lu_env *env, struct mdd_device *mdd,
182                  struct lustre_cfg *lcfg)
183 {
184         struct obd_device      *obd;
185         int rc;
186         ENTRY;
187
188         obd = mdd2obd_dev(mdd);
189         LASSERT(obd);
190
191         rc = class_cleanup(obd, lcfg);
192         if (rc)
193                 GOTO(lcfg_cleanup, rc);
194
195         obd->obd_upcall.onu_upcall = NULL;
196         obd->obd_upcall.onu_owner = NULL;
197         rc = class_detach(obd, lcfg);
198         if (rc)
199                 GOTO(lcfg_cleanup, rc);
200         mdd->mdd_obd_dev = NULL;
201
202         EXIT;
203 lcfg_cleanup:
204         return rc;
205 }
206
207 int mdd_get_md(const struct lu_env *env, struct mdd_object *obj,
208                void *md, int *md_size, const char *name)
209 {
210         int rc;
211         ENTRY;
212
213         rc = mdo_xattr_get(env, obj, mdd_buf_get(env, md, *md_size), name,
214                            mdd_object_capa(env, obj));
215         /*
216          * XXX: Handling of -ENODATA, the right way is to have ->do_md_get()
217          * exported by dt layer.
218          */
219         if (rc == 0 || rc == -ENODATA) {
220                 *md_size = 0;
221                 rc = 0;
222         } else if (rc < 0) {
223                 CDEBUG(D_OTHER, "Error %d reading eadata - %d\n",
224                        rc, *md_size);
225         } else {
226                 /* XXX: Convert lov EA but fixed after verification test. */
227                 *md_size = rc;
228         }
229
230         RETURN(rc);
231 }
232
233 int mdd_get_md_locked(const struct lu_env *env, struct mdd_object *obj,
234                       void *md, int *md_size, const char *name)
235 {
236         int rc = 0;
237         mdd_read_lock(env, obj, MOR_TGT_CHILD);
238         rc = mdd_get_md(env, obj, md, md_size, name);
239         mdd_read_unlock(env, obj);
240         return rc;
241 }
242
243 static int mdd_lov_set_stripe_md(const struct lu_env *env,
244                                  struct mdd_object *obj, struct lu_buf *buf,
245                                  struct thandle *handle)
246 {
247         struct mdd_device       *mdd = mdo2mdd(&obj->mod_obj);
248         struct obd_device       *obd = mdd2obd_dev(mdd);
249         struct obd_export       *lov_exp = obd->u.mds.mds_lov_exp;
250         struct lov_stripe_md    *lsm = NULL;
251         int rc;
252         ENTRY;
253
254         LASSERT(S_ISDIR(mdd_object_type(obj)) || S_ISREG(mdd_object_type(obj)));
255         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp, 0,
256                            &lsm, buf->lb_buf);
257         if (rc)
258                 RETURN(rc);
259         obd_free_memmd(lov_exp, &lsm);
260
261         rc = mdd_xattr_set_txn(env, obj, buf, XATTR_NAME_LOV, 0, handle);
262
263         CDEBUG(D_INFO, "set lov ea of "DFID" rc %d \n", PFID(mdo2fid(obj)), rc);
264         RETURN(rc);
265 }
266
267 /*
268  * Permission check is done before call it,
269  * no need check again.
270  */
271 static int mdd_lov_set_dir_md(const struct lu_env *env,
272                               struct mdd_object *obj, struct lu_buf *buf,
273                               struct thandle *handle)
274 {
275         struct lov_user_md *lum = NULL;
276         int rc = 0;
277         ENTRY;
278
279         LASSERT(S_ISDIR(mdd_object_type(obj)));
280         lum = (struct lov_user_md*)buf->lb_buf;
281
282         /* if { size, offset, count } = { 0, -1, 0 } and no pool
283          * (i.e. all default values specified) then delete default
284          * striping from dir. */
285         if (LOVEA_DELETE_VALUES(lum->lmm_stripe_size, lum->lmm_stripe_count,
286                                 lum->lmm_stripe_offset) &&
287             lum->lmm_magic != LOV_USER_MAGIC_V3) {
288                 rc = mdd_xattr_set_txn(env, obj, &LU_BUF_NULL,
289                                        XATTR_NAME_LOV, 0, handle);
290                 if (rc == -ENODATA)
291                         rc = 0;
292                 CDEBUG(D_INFO, "delete lov ea of "DFID" rc %d \n",
293                                 PFID(mdo2fid(obj)), rc);
294         } else {
295                 rc = mdd_lov_set_stripe_md(env, obj, buf, handle);
296         }
297         RETURN(rc);
298 }
299
300 int mdd_lsm_sanity_check(const struct lu_env *env,  struct mdd_object *obj)
301 {
302         struct lu_attr   *tmp_la = &mdd_env_info(env)->mti_la;
303         struct md_ucred  *uc     = md_ucred(env);
304         int rc;
305         ENTRY;
306
307         rc = mdd_la_get(env, obj, tmp_la, BYPASS_CAPA);
308         if (rc)
309                 RETURN(rc);
310
311         if ((uc->mu_fsuid != tmp_la->la_uid) &&
312             !mdd_capable(uc, CFS_CAP_FOWNER))
313                 rc = mdd_permission_internal_locked(env, obj, tmp_la,
314                                                     MAY_WRITE, MOR_TGT_CHILD);
315
316         RETURN(rc);
317 }
318
319 int mdd_lov_set_md(const struct lu_env *env, struct mdd_object *pobj,
320                    struct mdd_object *child, struct lov_mds_md *lmmp,
321                    int lmm_size, struct thandle *handle, int set_stripe)
322 {
323         struct lu_buf *buf;
324         cfs_umode_t mode;
325         int rc = 0;
326         ENTRY;
327
328         buf = mdd_buf_get(env, lmmp, lmm_size);
329         mode = mdd_object_type(child);
330         if (S_ISREG(mode) && lmm_size > 0) {
331                 if (set_stripe) {
332                         rc = mdd_lov_set_stripe_md(env, child, buf, handle);
333                 } else {
334                         rc = mdd_xattr_set_txn(env, child, buf,
335                                                XATTR_NAME_LOV, 0, handle);
336                 }
337         } else if (S_ISDIR(mode)) {
338                 if (lmmp == NULL && lmm_size == 0) {
339                         struct mdd_device *mdd = mdd_obj2mdd_dev(child);
340                         struct lov_mds_md *lmm = mdd_max_lmm_get(env, mdd);
341                         int size = sizeof(struct lov_mds_md_v3);
342
343                         /* Get parent dir stripe and set */
344                         if (pobj != NULL)
345                                 rc = mdd_get_md_locked(env, pobj, lmm, &size,
346                                                        XATTR_NAME_LOV);
347                         if (rc > 0) {
348                                 buf = mdd_buf_get(env, lmm, size);
349                                 rc = mdd_xattr_set_txn(env, child, buf,
350                                                        XATTR_NAME_LOV, 0,
351                                                        handle);
352                                 if (rc)
353                                         CERROR("error on copy stripe info: rc "
354                                                 "= %d\n", rc);
355                         }
356                 } else {
357                         LASSERT(lmmp != NULL && lmm_size > 0);
358                         rc = mdd_lov_set_dir_md(env, child, buf, handle);
359                 }
360         }
361         CDEBUG(D_INFO, "Set lov md %p size %d for fid "DFID" rc %d\n",
362                         lmmp, lmm_size, PFID(mdo2fid(child)), rc);
363         RETURN(rc);
364 }
365
366 int mdd_lov_objid_prepare(struct mdd_device *mdd, struct lov_mds_md *lmm)
367 {
368         /* copy mds_lov code is using wrong layer */
369         return mds_lov_prepare_objids(mdd->mdd_obd_dev, lmm);
370 }
371
372 int mdd_declare_lov_objid_update(const struct lu_env *env,
373                                  struct mdd_device *mdd,
374                                  struct thandle *handle)
375 {
376         struct obd_device *obd = mdd2obd_dev(mdd);
377         int size;
378
379         /* in prepare we create local files */
380         if (unlikely(mdd->mdd_capa == NULL))
381                 return 0;
382
383         /* XXX: this is a temporary solution to declare llog changes
384          *      will be fixed in 2.3 with new llog implementation */
385
386         size = obd->u.mds.mds_lov_desc.ld_tgt_count * sizeof(obd_id);
387         return dt_declare_record_write(env, mdd->mdd_capa, size, 0, handle);
388 }
389
390 void mdd_lov_objid_update(struct mdd_device *mdd, struct lov_mds_md *lmm)
391 {
392         /* copy mds_lov code is using wrong layer */
393         mds_lov_update_objids(mdd->mdd_obd_dev, lmm);
394 }
395
396 void mdd_lov_create_finish(const struct lu_env *env, struct mdd_device *mdd,
397                            struct lov_mds_md *lmm, int lmm_size,
398                            const struct md_op_spec *spec)
399 {
400         if (lmm && !spec->no_create)
401                 OBD_FREE_LARGE(lmm, lmm_size);
402 }
403
404 int mdd_lov_create(const struct lu_env *env, struct mdd_device *mdd,
405                    struct mdd_object *parent, struct mdd_object *child,
406                    struct lov_mds_md **lmm, int *lmm_size,
407                    const struct md_op_spec *spec, struct md_attr *ma)
408 {
409         struct obd_device     *obd = mdd2obd_dev(mdd);
410         struct obd_export     *lov_exp = obd->u.mds.mds_lov_exp;
411         struct lu_site        *site = mdd2lu_dev(mdd)->ld_site;
412         struct obdo           *oa;
413         struct lov_stripe_md  *lsm = NULL;
414         const void            *eadata = spec->u.sp_ea.eadata;
415         __u64                  create_flags = spec->sp_cr_flags;
416         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
417         struct lu_attr        *la = &ma->ma_attr;
418         int                    rc = 0;
419         ENTRY;
420
421         if (!md_should_create(create_flags)) {
422                 *lmm_size = 0;
423                 RETURN(0);
424         }
425         oti_init(oti, NULL);
426
427         /* replay case, has objects already, only get lov from eadata */
428         if (spec->no_create != 0) {
429                 *lmm = (struct lov_mds_md *)spec->u.sp_ea.eadata;
430                 *lmm_size = spec->u.sp_ea.eadatalen;
431                 if (*lmm_size == lov_mds_md_size((*lmm)->lmm_stripe_count,
432                                                  (*lmm)->lmm_magic)) {
433                         RETURN(0);
434                 } else {
435                         CERROR("incorrect lsm received during recovery\n");
436                         RETURN(-EPROTO);
437                 }
438         }
439
440         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_ALLOC_OBDO))
441                 GOTO(out_ids, rc = -ENOMEM);
442
443         LASSERT(lov_exp != NULL);
444         oa = &mdd_env_info(env)->mti_oa;
445
446         oa->o_uid = 0; /* must have 0 uid / gid on OST */
447         oa->o_gid = 0;
448         oa->o_seq = mdt_to_obd_objseq(lu_site2md(site)->ms_node_id);
449         oa->o_mode = S_IFREG | 0600;
450         oa->o_id = fid_ver_oid(mdd_object_fid(child));
451         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLFLAGS |
452                 OBD_MD_FLMODE | OBD_MD_FLUID | OBD_MD_FLGID | OBD_MD_FLGROUP;
453         oa->o_size = 0;
454
455         if (!(create_flags & MDS_OPEN_HAS_OBJS)) {
456                 if (create_flags & MDS_OPEN_HAS_EA) {
457                         LASSERT(eadata != NULL);
458                         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp,
459                                            0, &lsm, (void*)eadata);
460                         if (rc)
461                                 GOTO(out_oti, rc);
462                 } else {
463                         /* get lov ea from parent and set to lov */
464                         struct lov_mds_md *_lmm;
465                         int _lmm_size = mdd_lov_mdsize(env, mdd);
466
467                         LASSERT(parent != NULL);
468
469                         _lmm = mdd_max_lmm_get(env, mdd);
470                         if (_lmm == NULL)
471                                 GOTO(out_oti, rc = -ENOMEM);
472
473                         rc = mdd_get_md_locked(env, parent, _lmm,
474                                                &_lmm_size,
475                                                XATTR_NAME_LOV);
476                         if (rc > 0) {
477                                 _lmm_size = mdd_lov_mdsize(env, mdd);
478                                 rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE,
479                                                    lov_exp, _lmm_size,
480                                                    &lsm, _lmm);
481                         }
482                         if (rc)
483                                 GOTO(out_oti, rc);
484                 }
485
486                 OBD_FAIL_TIMEOUT(OBD_FAIL_MDS_OPEN_WAIT_CREATE, 10);
487                 rc = obd_create(env, lov_exp, oa, &lsm, oti);
488                 if (rc) {
489                         if (rc > 0) {
490                                 CERROR("Create error for "DFID": %d\n",
491                                        PFID(mdo2fid(child)), rc);
492                                 rc = -EIO;
493                         }
494                         GOTO(out_oti, rc);
495                 }
496
497                 if (ma->ma_valid & MA_LAY_GEN)
498                         /* If we already have a lsm, the file is not new and we
499                          * are about to change the layout, so we have to bump
500                          * the generation. It is worth noting that old versions
501                          * will be confused by a non-zero gen, that's why
502                          * OBD_INCOMPAT_LMM_VER has been introduced */
503                         lsm->lsm_layout_gen = ma->ma_layout_gen + 1;
504                 else
505                         /* Start with a null generation for backward
506                          * compatiblity with old versions */
507                         lsm->lsm_layout_gen = 0;
508
509                 LASSERT_SEQ_IS_MDT(lsm->lsm_object_seq);
510         } else {
511                 LASSERT(eadata != NULL);
512                 rc = obd_iocontrol(OBD_IOC_LOV_SETEA, lov_exp, 0, &lsm,
513                                    (void*)eadata);
514                 if (rc)
515                         GOTO(out_oti, rc);
516
517                 if (ma->ma_valid & MA_LAY_GEN)
518                         lsm->lsm_layout_gen = ma->ma_layout_gen;
519                 else
520                         lsm->lsm_layout_gen = 0;
521         }
522
523         lsm->lsm_object_id = fid_ver_oid(mdd_object_fid(child));
524         lsm->lsm_object_seq = fid_seq(mdd_object_fid(child));
525         /*
526          * Sometimes, we may truncate some object(without lsm) then open it
527          * (with write flags), so creating lsm above.  The Nonzero(truncated)
528          * size should tell ost, since size attr is in charge by OST.
529          */
530         if (la->la_size && la->la_valid & LA_SIZE) {
531                 struct obd_info *oinfo = &mdd_env_info(env)->mti_oi;
532
533                 memset(oinfo, 0, sizeof(*oinfo));
534
535                 /* When setting attr to ost, FLBKSZ is not needed. */
536                 oa->o_valid &= ~OBD_MD_FLBLKSZ;
537                 obdo_from_la(oa, la, LA_TYPE | LA_ATIME | LA_MTIME |
538                                      LA_CTIME | LA_SIZE);
539                 /*
540                  * XXX: Pack lustre id to OST, in OST, it will be packed by
541                  * filter_fid, but can not see what is the usages. So just pack
542                  * o_seq o_ver here, maybe fix it after this cycle.
543                  */
544                 obdo_set_parent_fid(oa, mdd_object_fid(child));
545                 oinfo->oi_oa = oa;
546                 oinfo->oi_md = lsm;
547                 oinfo->oi_capa = NULL;
548                 oinfo->oi_policy.l_extent.start = la->la_size;
549                 oinfo->oi_policy.l_extent.end = OBD_OBJECT_EOF;
550
551                 rc = obd_punch_rqset(lov_exp, oinfo, oti);
552                 if (rc) {
553                         CERROR("Error setting attrs for "DFID": rc %d\n",
554                                PFID(mdo2fid(child)), rc);
555                         if (rc > 0) {
556                                 CERROR("obd_setattr for "DFID" rc %d\n",
557                                         PFID(mdo2fid(child)), rc);
558                                 rc = -EIO;
559                         }
560                         GOTO(out_oti, rc);
561                 }
562         }
563         /* blksize should be changed after create data object */
564         la->la_valid |= LA_BLKSIZE;
565         la->la_blksize = oa->o_blksize;
566         *lmm = NULL;
567         rc = obd_packmd(lov_exp, lmm, lsm);
568         if (rc < 0) {
569                 CERROR("Cannot pack lsm, err = %d\n", rc);
570                 GOTO(out_oti, rc);
571         }
572         if (mdd_lov_objid_prepare(mdd, *lmm) != 0) {
573                 CERROR("Not have memory for update objid\n");
574                 OBD_FREE(*lmm, rc);
575                 *lmm = NULL;
576                 GOTO(out_oti, rc = -ENOMEM);
577         }
578         *lmm_size = rc;
579         rc = 0;
580         EXIT;
581 out_oti:
582         oti_free_cookies(oti);
583 out_ids:
584         if (lsm)
585                 obd_free_memmd(lov_exp, &lsm);
586
587         return rc;
588 }
589
590 /*
591  * used when destroying orphans and from mds_reint_unlink() when MDS wants to
592  * destroy objects on OSS.
593  */
594 int mdd_lovobj_unlink(const struct lu_env *env, struct mdd_device *mdd,
595                       struct mdd_object *obj, struct lu_attr *la,
596                       struct lov_mds_md *lmm, int lmm_size,
597                       struct llog_cookie *logcookies,
598                       int log_unlink)
599 {
600         struct obd_device     *obd = mdd2obd_dev(mdd);
601         struct obd_export     *lov_exp = obd->u.mds.mds_lov_exp;
602         struct lov_stripe_md  *lsm = NULL;
603         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
604         struct obdo           *oa = &mdd_env_info(env)->mti_oa;
605         struct lu_site        *site = mdd2lu_dev(mdd)->ld_site;
606         int rc;
607         ENTRY;
608
609         if (lmm_size == 0)
610                 RETURN(0);
611
612         rc = obd_unpackmd(lov_exp, &lsm, lmm, lmm_size);
613         if (rc < 0) {
614                 CERROR("Error unpack md %p\n", lmm);
615                 RETURN(rc);
616         } else {
617                 LASSERT(rc >= sizeof(*lsm));
618                 rc = 0;
619         }
620
621         oa->o_id = lsm->lsm_object_id;
622         oa->o_seq = mdt_to_obd_objseq(lu_site2md(site)->ms_node_id);
623         oa->o_mode = la->la_mode & S_IFMT;
624         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLGROUP;
625
626         oti_init(oti, NULL);
627         if (log_unlink && logcookies) {
628                 oa->o_valid |= OBD_MD_FLCOOKIE;
629                 oti->oti_logcookies = logcookies;
630         }
631
632         CDEBUG(D_INFO, "destroying OSS object "LPU64":"LPU64"\n", oa->o_seq,
633                oa->o_id);
634
635         rc = obd_destroy(env, lov_exp, oa, lsm, oti, NULL, NULL);
636
637         obd_free_memmd(lov_exp, &lsm);
638         RETURN(rc);
639 }
640
641 /*
642  * called with obj locked.
643  */
644 int mdd_lov_destroy(const struct lu_env *env, struct mdd_device *mdd,
645                     struct mdd_object *obj, struct lu_attr *la)
646 {
647         struct md_attr    *ma = &mdd_env_info(env)->mti_ma;
648         int                rc;
649         ENTRY;
650
651         LASSERT(mdd_write_locked(env, obj) != 0);
652
653         if (unlikely(!S_ISREG(mdd_object_type(obj))))
654                 RETURN(0);
655
656         if (unlikely(la->la_nlink != 0)) {
657                 CWARN("Attempt to destroy OSS object when nlink == %d\n",
658                       la->la_nlink);
659                 RETURN(0);
660         }
661
662         ma->ma_lmm_size = mdd_lov_mdsize(env, mdd);
663         ma->ma_lmm = mdd_max_lmm_get(env, mdd);
664         ma->ma_cookie_size = mdd_lov_cookiesize(env, mdd);
665         ma->ma_cookie = mdd_max_cookie_get(env, mdd);
666         if (ma->ma_lmm == NULL || ma->ma_cookie == NULL)
667                 RETURN(rc = -ENOMEM);
668
669         /* get lov ea */
670
671         rc = mdd_get_md(env, obj, ma->ma_lmm, &ma->ma_lmm_size,
672                         XATTR_NAME_LOV);
673
674         if (rc <= 0) {
675                 CWARN("Get lov ea failed for "DFID" rc = %d\n",
676                          PFID(mdo2fid(obj)), rc);
677                 if (rc == 0)
678                         rc = -ENOENT;
679                 RETURN(rc);
680         }
681
682         ma->ma_valid = MA_LOV;
683
684         rc = mdd_unlink_log(env, mdd, obj, ma);
685         if (rc) {
686                 CWARN("mds unlink log for "DFID" failed: %d\n",
687                        PFID(mdo2fid(obj)), rc);
688                 RETURN(rc);
689         }
690
691         if (ma->ma_valid & MA_COOKIE)
692                 rc = mdd_lovobj_unlink(env, mdd, obj, la,
693                                        ma->ma_lmm, ma->ma_lmm_size,
694                                        ma->ma_cookie, 1);
695         RETURN(rc);
696 }
697
698 int mdd_declare_unlink_log(const struct lu_env *env, struct mdd_object *obj,
699                            struct md_attr *ma, struct thandle *handle)
700 {
701         struct mdd_device *mdd = mdo2mdd(&obj->mod_obj);
702         int rc, i;
703         __u16 stripe;
704
705         LASSERT(obj);
706         LASSERT(ma);
707
708         if (!S_ISREG(lu_object_attr(&obj->mod_obj.mo_lu)))
709                 return 0;
710
711         rc = mdd_lmm_get_locked(env, obj, ma);
712         if (rc || !(ma->ma_valid & MA_LOV))
713                 return rc;
714
715         LASSERT(ma->ma_lmm);
716         if (le32_to_cpu(ma->ma_lmm->lmm_magic) != LOV_MAGIC_V1 &&
717                         le32_to_cpu(ma->ma_lmm->lmm_magic) != LOV_MAGIC_V3) {
718                 CERROR("%s: invalid LOV_MAGIC %08x on object "DFID"\n",
719                                 mdd->mdd_obd_dev->obd_name,
720                                 le32_to_cpu(ma->ma_lmm->lmm_magic),
721                                 PFID(lu_object_fid(&obj->mod_obj.mo_lu)));
722                 return -EINVAL;
723         }
724
725         stripe = le16_to_cpu(ma->ma_lmm->lmm_stripe_count);
726         if (stripe == LOV_ALL_STRIPES);
727                 stripe = mdd2obd_dev(mdd)->u.mds.mds_lov_desc.ld_tgt_count;
728
729         for (i = 0; i < stripe; i++) {
730                 rc = mdd_declare_llog_record(env, mdd,
731                                              sizeof(struct llog_unlink_rec),
732                                              handle);
733                 if (rc)
734                         return rc;
735         }
736
737         return rc;
738 }
739
740 int mdd_unlink_log(const struct lu_env *env, struct mdd_device *mdd,
741                    struct mdd_object *mdd_cobj, struct md_attr *ma)
742 {
743         LASSERT(ma->ma_valid & MA_LOV);
744
745         if ((ma->ma_cookie_size > 0) &&
746             (mds_log_op_unlink(mdd2obd_dev(mdd), ma->ma_lmm, ma->ma_lmm_size,
747                                ma->ma_cookie, ma->ma_cookie_size) > 0)) {
748                 CDEBUG(D_HA, "DEBUG: unlink log is added for object "DFID"\n",
749                        PFID(mdd_object_fid(mdd_cobj)));
750                 ma->ma_valid |= MA_COOKIE;
751         }
752         return 0;
753 }
754
755 int mdd_log_op_setattr(struct obd_device *obd, __u32 uid, __u32 gid,
756                        struct lov_mds_md *lmm, int lmm_size,
757                        struct llog_cookie *logcookies, int cookies_size)
758 {
759         struct mds_obd *mds = &obd->u.mds;
760         struct lov_stripe_md *lsm = NULL;
761         struct llog_setattr64_rec *lsr;
762         struct llog_ctxt *ctxt;
763         int rc;
764         ENTRY;
765
766         if (IS_ERR(mds->mds_lov_obd))
767                 RETURN(PTR_ERR(mds->mds_lov_obd));
768
769         rc = obd_unpackmd(mds->mds_lov_exp, &lsm, lmm, lmm_size);
770         if (rc < 0)
771                 RETURN(rc);
772
773         OBD_ALLOC(lsr, sizeof(*lsr));
774         if (!lsr)
775                 GOTO(out, rc = -ENOMEM);
776
777         /* prepare setattr log record */
778         lsr->lsr_hdr.lrh_len = lsr->lsr_tail.lrt_len = sizeof(*lsr);
779         lsr->lsr_hdr.lrh_type = MDS_SETATTR64_REC;
780         lsr->lsr_uid = uid;
781         lsr->lsr_gid = gid;
782
783         /* write setattr log */
784         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
785         rc = llog_add(ctxt, &lsr->lsr_hdr, lsm, logcookies,
786                       cookies_size / sizeof(struct llog_cookie));
787
788         llog_ctxt_put(ctxt);
789
790         OBD_FREE(lsr, sizeof(*lsr));
791  out:
792         obd_free_memmd(mds->mds_lov_exp, &lsm);
793         RETURN(rc);
794 }
795
796 int mdd_setattr_log(const struct lu_env *env, struct mdd_device *mdd,
797                     const struct md_attr *ma,
798                     struct lov_mds_md *lmm, int lmm_size,
799                     struct llog_cookie *logcookies, int cookies_size)
800 {
801         struct obd_device *obd = mdd2obd_dev(mdd);
802
803         /* journal chown/chgrp in llog, just like unlink */
804         if (lmm_size > 0) {
805                 CDEBUG(D_INFO, "setattr llog for uid/gid=%lu/%lu\n",
806                         (unsigned long)ma->ma_attr.la_uid,
807                         (unsigned long)ma->ma_attr.la_gid);
808                 return mdd_log_op_setattr(obd, ma->ma_attr.la_uid,
809                                           ma->ma_attr.la_gid, lmm,
810                                           lmm_size, logcookies,
811                                           cookies_size);
812         } else
813                 return 0;
814 }
815
816 static int mdd_osc_setattr_async(struct obd_device *obd, __u32 uid, __u32 gid,
817                           struct lov_mds_md *lmm, int lmm_size,
818                           struct llog_cookie *logcookies, const struct lu_fid *parent,
819                           struct obd_capa *oc)
820 {
821         struct mds_obd *mds = &obd->u.mds;
822         struct obd_trans_info oti = { 0 };
823         struct obd_info oinfo = { { { 0 } } };
824         int rc;
825         ENTRY;
826
827         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_OST_SETATTR))
828                 RETURN(0);
829
830         /* first get memory EA */
831         OBDO_ALLOC(oinfo.oi_oa);
832         if (!oinfo.oi_oa)
833                 RETURN(-ENOMEM);
834
835         LASSERT(lmm);
836
837         rc = obd_unpackmd(mds->mds_lov_exp, &oinfo.oi_md, lmm, lmm_size);
838         if (rc < 0) {
839                 CERROR("Error unpack md %p for obj "DFID"\n", lmm,
840                         PFID(parent));
841                 GOTO(out, rc);
842         }
843
844         /* then fill oa */
845         oinfo.oi_oa->o_uid = uid;
846         oinfo.oi_oa->o_gid = gid;
847         oinfo.oi_oa->o_id = oinfo.oi_md->lsm_object_id;
848         oinfo.oi_oa->o_seq = oinfo.oi_md->lsm_object_seq;
849         oinfo.oi_oa->o_valid |= OBD_MD_FLID | OBD_MD_FLGROUP |
850                                 OBD_MD_FLUID | OBD_MD_FLGID;
851         if (logcookies) {
852                 oinfo.oi_oa->o_valid |= OBD_MD_FLCOOKIE;
853                 oti.oti_logcookies = logcookies;
854         }
855
856         obdo_set_parent_fid(oinfo.oi_oa, parent);
857         oinfo.oi_capa = oc;
858
859         /* do async setattr from mds to ost not waiting for responses. */
860         rc = obd_setattr_async(mds->mds_lov_exp, &oinfo, &oti, NULL);
861         if (rc)
862                 CDEBUG(D_INODE, "mds to ost setattr objid 0x"LPX64
863                        " on ost error %d\n", oinfo.oi_md->lsm_object_id, rc);
864 out:
865         if (oinfo.oi_md)
866                 obd_free_memmd(mds->mds_lov_exp, &oinfo.oi_md);
867         OBDO_FREE(oinfo.oi_oa);
868         RETURN(rc);
869 }
870
871 int mdd_lov_setattr_async(const struct lu_env *env, struct mdd_object *obj,
872                           struct lov_mds_md *lmm, int lmm_size,
873                           struct llog_cookie *logcookies)
874 {
875         struct mdd_device   *mdd = mdo2mdd(&obj->mod_obj);
876         struct obd_device   *obd = mdd2obd_dev(mdd);
877         struct lu_attr      *tmp_la = &mdd_env_info(env)->mti_la;
878         const struct lu_fid *fid = mdd_object_fid(obj);
879         int rc = 0;
880         ENTRY;
881
882         mdd_read_lock(env, obj, MOR_TGT_CHILD);
883         rc = mdo_attr_get(env, obj, tmp_la, mdd_object_capa(env, obj));
884         mdd_read_unlock(env, obj);
885         if (rc)
886                 RETURN(rc);
887
888         rc = mdd_osc_setattr_async(obd, tmp_la->la_uid, tmp_la->la_gid, lmm,
889                                    lmm_size, logcookies, fid, NULL);
890         RETURN(rc);
891 }
892
893 static int grouplock_blocking_ast(struct ldlm_lock *lock,
894                                   struct ldlm_lock_desc *desc,
895                                   void *data, int flag)
896 {
897         struct md_attr *ma = data;
898         struct lustre_handle lockh;
899         int rc = 0;
900         ENTRY;
901
902         switch (flag)
903         {
904                 case LDLM_CB_BLOCKING :
905                         /* lock is canceled */
906                         CDEBUG(D_DLMTRACE, "Lock %p is canceled\n", lock);
907
908                         ldlm_lock2handle(lock, &lockh);
909                         rc = ldlm_cli_cancel(&lockh);
910
911                         break;
912                 case LDLM_CB_CANCELING :
913                         CDEBUG(D_DLMTRACE,
914                                "Lock %p has been canceled, do cleaning\n",
915                                lock);
916
917                         if (ma && ma->ma_som)
918                                 OBD_FREE_PTR(ma->ma_som);
919                         if (ma)
920                                 OBD_FREE_PTR(ma);
921                         break;
922                 default:
923                         LBUG();
924         }
925         RETURN(rc);
926 }
927
928 static int grouplock_glimpse_ast(struct ldlm_lock *lock, void *data)
929 {
930         struct ptlrpc_request *req = data;
931         struct ost_lvb *lvb;
932         int rc;
933         struct md_attr *ma;
934         ENTRY;
935
936         ma = lock->l_ast_data;
937
938         req_capsule_extend(&req->rq_pill, &RQF_LDLM_GL_CALLBACK);
939         req_capsule_set_size(&req->rq_pill, &RMF_DLM_LVB, RCL_SERVER,
940                              sizeof(*lvb));
941         rc = req_capsule_server_pack(&req->rq_pill);
942         if (rc) {
943                 CERROR("failed pack reply: %d\n", rc);
944                 GOTO(out, rc);
945         }
946
947         lvb = req_capsule_server_get(&req->rq_pill, &RMF_DLM_LVB);
948
949         if ((ma) && (ma->ma_valid & MA_SOM)) {
950                 lvb->lvb_size = ma->ma_som->msd_size;
951                 lvb->lvb_blocks = ma->ma_som->msd_blocks;
952         } else if ((ma) && (ma->ma_valid & MA_INODE)) {
953                 lvb->lvb_size = ma->ma_attr.la_size;
954                 lvb->lvb_blocks = ma->ma_attr.la_blocks;
955         } else {
956                 lvb->lvb_size = 0;
957                 rc = -ELDLM_NO_LOCK_DATA;
958         }
959
960         EXIT;
961 out:
962         if (rc == -ELDLM_NO_LOCK_DATA)
963                 lustre_pack_reply(req, 1, NULL, NULL);
964
965         req->rq_status = rc;
966         return rc;
967 }
968
969 int mdd_file_lock(const struct lu_env *env, struct md_object *obj,
970                   struct lov_mds_md *lmm, struct ldlm_extent *extent,
971                   struct lustre_handle *lockh)
972 {
973         struct ldlm_enqueue_info einfo = { 0 };
974         struct obd_info oinfo = { { { 0 } } };
975         struct obd_device *obd;
976         struct obd_export *lov_exp;
977         struct lov_stripe_md *lsm = NULL;
978         struct md_attr *ma = NULL;
979         int rc;
980         ENTRY;
981
982         obd = mdo2mdd(obj)->mdd_obd_dev;
983         lov_exp = obd->u.mds.mds_lov_exp;
984
985         obd_unpackmd(lov_exp, &lsm, lmm,
986                      lov_mds_md_size(lmm->lmm_stripe_count, lmm->lmm_magic));
987
988         OBD_ALLOC_PTR(ma);
989         if (ma == NULL)
990                 GOTO(out, rc = -ENOMEM);
991
992         OBD_ALLOC_PTR(ma->ma_som);
993         if (ma->ma_som == NULL)
994                 GOTO(out, rc = -ENOMEM);
995
996         ma->ma_need = MA_SOM | MA_INODE;
997         mo_attr_get(env, obj, ma);
998
999         einfo.ei_type = LDLM_EXTENT;
1000         einfo.ei_mode = LCK_GROUP;
1001         einfo.ei_cb_bl = grouplock_blocking_ast;
1002         einfo.ei_cb_cp = ldlm_completion_ast;
1003         einfo.ei_cb_gl = grouplock_glimpse_ast;
1004
1005         if (ma->ma_valid & (MA_SOM | MA_INODE))
1006                 einfo.ei_cbdata = ma;
1007         else
1008                 einfo.ei_cbdata = NULL;
1009
1010         memset(&oinfo.oi_policy, 0, sizeof(oinfo.oi_policy));
1011         oinfo.oi_policy.l_extent = *extent;
1012         oinfo.oi_lockh = lockh;
1013         oinfo.oi_md = lsm;
1014         oinfo.oi_flags = 0;
1015
1016         rc = obd_enqueue(lov_exp, &oinfo, &einfo, NULL);
1017         /* ei_cbdata is used as a free flag at exit */
1018         if (rc)
1019                 einfo.ei_cbdata = NULL;
1020
1021         obd_unpackmd(lov_exp, &lsm, NULL, 0);
1022
1023 out:
1024         /* ma is freed if not used as callback data */
1025         if ((einfo.ei_cbdata == NULL) && ma && ma->ma_som)
1026                 OBD_FREE_PTR(ma->ma_som);
1027         if ((einfo.ei_cbdata == NULL) && ma)
1028                 OBD_FREE_PTR(ma);
1029
1030         RETURN(rc);
1031 }
1032
1033 int mdd_file_unlock(const struct lu_env *env, struct md_object *obj,
1034                     struct lov_mds_md *lmm, struct lustre_handle *lockh)
1035 {
1036         struct obd_device *obd;
1037         struct obd_export *lov_exp;
1038         struct lov_stripe_md *lsm = NULL;
1039         int rc;
1040         ENTRY;
1041
1042         LASSERT(lustre_handle_is_used(lockh));
1043
1044         obd = mdo2mdd(obj)->mdd_obd_dev;
1045         lov_exp = obd->u.mds.mds_lov_exp;
1046
1047         obd_unpackmd(lov_exp, &lsm, lmm,
1048                      lov_mds_md_size(lmm->lmm_stripe_count, lmm->lmm_magic));
1049
1050         rc = obd_cancel(lov_exp, lsm, LCK_GROUP, lockh);
1051
1052         obd_unpackmd(lov_exp, &lsm, NULL, 0);
1053
1054         RETURN(rc);
1055 }
1056
1057 /* file lov is in ma->ma_lmm */
1058 /* requested lov is in info->mti_spec.u.sp_ea.eadata */
1059 int mdd_lum_lmm_cmp(const struct lu_env *env, struct md_object *cobj,
1060                     const struct md_op_spec *spec, struct md_attr *ma)
1061 {
1062         struct obd_export *lov_exp =
1063                 mdd2obd_dev(mdo2mdd(cobj))->u.mds.mds_lov_exp;
1064         struct lov_mds_md *lmm = ma->ma_lmm;
1065         struct lov_user_md_v3 *lum =
1066                 (struct lov_user_md_v3 *)(spec->u.sp_ea.eadata);
1067         struct lov_stripe_md *lsm = NULL;
1068         int lmm_magic, rc;
1069         ENTRY;
1070
1071         rc = obd_unpackmd(lov_exp, &lsm, lmm,
1072                           lov_mds_md_size(lmm->lmm_stripe_count,
1073                                           lmm->lmm_magic));
1074         ma->ma_layout_gen = lsm->lsm_layout_gen;
1075         ma->ma_valid |= MA_LAY_GEN;
1076
1077         rc = lov_lum_swab_if_needed(lum, &lmm_magic, NULL);
1078         if (rc)
1079                 GOTO(out, rc);
1080
1081         rc = lov_lum_lsm_cmp((struct lov_user_md *)lum, lsm);
1082         if (rc)
1083                 GOTO(out, rc);  /* keep GOTO to for traces */
1084
1085 out:
1086         /* free lsm */
1087         obd_unpackmd(lov_exp, &lsm, NULL, 0);
1088         return rc;
1089 }